Google DeepMind 推出了首个能以银牌得主水平解决国际数学奥林匹克竞赛问题的 AI。
该 AI 综合了 AlphaProof 和改进版的 AlphaGeometry 2,能解决代数、组合数学、几何学和数论问题,并在今年的比赛中获得了 28 分,达到银牌水平!
AlphaProof和AlphaGeometry 2,用于解决复杂的数学推理问题。
AlphaProof 使用 Lean 编程语言进行形式推理,并结合 AlphaZero 强化学习算法进行训练,而 AlphaGeometry 2 则是一种神经符号混合系统,解决问题的效率显著提高。
这一系统有望加速数学研究并推动通用人工智能的发展。
•该 AI 结合了两种模型:用于形式推理的 AlphaProof 和改进版的 AlphaGeometry 2。
•AI 需要解决今年的六个 IMO 问题,这些问题涉及代数、组合数学、几何学和数论,并由数学家 W.T. Gowers 和 Joseph K. Myers 监督评分。
•AI 解决了 4 个问题,获得了 28 分,相当于获得银牌。
•AlphaProof 能在 Lean 编程语言中创建证明,并结合 AlphaZero 强化学习算法进行训练。
•AlphaProof 通过将一百万个非正式数学问题翻译成形式化数学语言来训练,使用 AlphaZero 算法逐步解决更具挑战性的问题。
•由于缺乏人类书写的数据,数学编程语言如 Lean 的使用受限,因此 DeepMind 对 Gemini 模型进行了微调,以将自然语言问题翻译为形式化问题进行训练。
•AlphaGeometry 2 是一种神经符号混合系统,能够解决 83% 的历史几何问题,相较于其前身的 53% 提高显著。
•AlphaGeometry 2 可以在 19 秒内解决今年的 IMO 第四题。
•新系统有望加速 AI 驱动的数学研究,从快速完成证明元素到最终发现新知识,推动通用人工智能(AGI)进步。
详细介绍:https://dpmd.ai/imo-silver
- 复制链接
- 举报