非常高兴介绍我们的最新工作:MathBench(ACL 2024 Findings)!🔥 5个阶段:小学、初中、高中和大学水平📚 涵盖理论和实践问题📊 CircularEval确保了稳健的评估🤖 GPT-4o在高中和大学阶段显著优于竞争对手!数据:https://github.com/open-compass/MathBench论文:https://arxiv.org/abs/2405.12209