热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_36209030
ChingKitWong
2 年前
trueweixin_36209030

非常高兴介绍我们的最新工作:MathBench(ACL 2024 Findings)!
🔥 5个阶段:小学、初中、高中和大学水平
📚 涵盖理论和实践问题
📊 CircularEval确保了稳健的评估
🤖 GPT-4o在高中和大学阶段显著优于竞争对手!

数据:
https://github.com/open-compass/MathBench
论文:https://arxiv.org/abs/2405.12209

CSDN App 扫码分享
分享
评论
点赞
  • 复制链接
  • 举报
下一条:
【🚀 激动人心的消息!Compass Arena 携顶级中国大型语言模型 (LLM) 登陆 @pakerface 🌍,现在支持 Qwen2-72B-Instruct @推理文学狂热者。- HF: https://huggingface.co/spaces/opencompass/CompassArena - ModelScope: https://modelscope.cn/studios/opencompass/CompassArena/summary - OpenCompass: https://opencompass.org.cn/arena欢迎加入!🎉】
立即登录