三个前沿模型的奇怪弱点:1) ChatGPT-4o不“喜欢”进行搜索,即使在适当的时候。这会导致错误的答案。2) Claude 3.5过于奉承。任何轻微的纠正都会导致重大路线变化。3) Gemini不清楚使用代码的规则。