热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_36209030
ChingKitWong
2 年前
trueweixin_36209030

【🎉 大新闻!Compass Arena 的首个排行榜正式上线🥳
💡 你可以根据与大语言模型(LLMs)的真实互动进行投票!
👏 我们在 Compass Arena 拥有近30个顶级大语言模型,包括 GPT-4o
@懒得和狗讲道理、GLM4、ERNIE 4.0、Qwen2 @推理文学狂热者、abab6.5 等等!
🔗 Compass Arena: https://opencompass.org.cn/arena
👑 让我们看看谁能登顶!】

CSDN App 扫码分享
分享
评论
点赞
  • 复制链接
  • 举报
下一条:
非常高兴介绍我们的最新工作:MathBench(ACL 2024 Findings)!🔥 5个阶段:小学、初中、高中和大学水平📚 涵盖理论和实践问题📊 CircularEval确保了稳健的评估🤖 GPT-4o在高中和大学阶段显著优于竞争对手!数据:https://github.com/open-compass/MathBench论文:https://arxiv.org/abs/2405.12209
立即登录