GPT-3在MMLU基准测试中得分为40%。GPT-4的首次发布得分为86%,而今天GPT-4o得分为89%。仅增加了3% — 这相当于一年的进步。如果按照先前的趋势绘制,我们现在应该达到100%,甚至可能是120%。人工智能遇到了瓶颈。