热门

最新

红包

立Flag

投票

同城

我的

发布
devbigcode
智者无疆1
2 年前
truedevbigcode

发布 BigCodeBench-Hard:一组更具挑战性和用户导向的任务子集。

BigCodeBench-Hard 提供了更准确的模型性能评估,我们还研究了一些最近的模型更新。

阅读更多:
https://huggingface.co/blog/terryyz/bigcodebench-hard
排行榜:https://huggingface.co/spaces/bigcode/bigcodebench-leaderboard

CSDN App 扫码分享
分享
评论
12
  • 复制链接
  • 举报
下一条:
令人兴奋的更新!🌟 Chatbox v1.3.15 引入了新的 Artifact Preview 功能。现在,您可以在生成的消息中直接预览 HTML 代码(包括 JS、CSS 和 TailwindCSS)。快来看看吧!https://chatboxai.app/help-center/changelog
立即登录