热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_40912980
exploit-cat
1 年前
trueweixin_40912980

事实还是虚构?NOCHA:用于评估大型语言模型长上下文推理的新基准

快速阅读:
https://www.marktechpost.com/2024/06/27/fact-or-fiction-nocha-a-new-benchmark-for-evaluating-long-context-reasoning-in-llms/

论文:https://arxiv.org/abs/2406.16264

GitHub:https://github.com/marzenakrp/nocha

NOCHA排行榜:https://novelchallenge.github.io/

@笑笑口常开啊 @oping wong
@weixin_31315567
@经年哲思
@你不是我你不行
@三奇贵人
@weixin_34797871
@weixin_29161785
@weixin_31315567

CSDN App 扫码分享
分享
评论
11
  • 复制链接
  • 举报
下一条:
Imbue团队从零开始训练70B参数模型:在预训练、评估和基础设施方面的创新,以实现先进的AI性能https://www.marktechpost.com/2024/06/27/imbue-team-trains-70b-parameter-model-from-scratch-innovations-in-pre-training-evaluation-and-infrastructure-for-advanced-ai-performance/@龙龙鱼鱼
立即登录