两个数学模型分别是:AlphaProof,这是一个基于强化学习的正式数学推理系统。以及 AlphaGeometry 2,几何问题解决系统的改进版本。在训练过程中,AlphaProof 通过证明或反驳数百万个问题来提高其性能。AlphaGeometry 2 的性能也得到了显著提升,能够解决历史上大部分 IMO 几何问题。而且通过对 Gemini 模型的微调,AlphaProof 能够自动将自然语言问题翻译成正式语言,从而创建了一个用于训练和解决问题的大型正式问题库。