事实还是虚构？NOCHA：用于评估大型语言模型长上下文推理的-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

trueweixin_40912980

事实还是虚构？NOCHA：用于评估大型语言模型长上下文推理的新基准

快速阅读：https://www.marktechpost.com/2024/06/27/fact-or-fiction-nocha-a-new-benchmark-for-evaluating-long-context-reasoning-in-llms/

论文：https://arxiv.org/abs/2406.16264

GitHub：https://github.com/marzenakrp/nocha

NOCHA排行榜：https://novelchallenge.github.io/

@笑笑口常开啊 @oping wong
@weixin_31315567
@经年哲思
 @你不是我你不行
 @三奇贵人
 @weixin_34797871
@weixin_29161785
@weixin_31315567

CSDN App 扫码分享

分享

评论

11

复制链接
举报

下一条：

Imbue团队从零开始训练70B参数模型：在预训练、评估和基础设施方面的创新，以实现先进的AI性能 https://www.marktechpost.com/2024/06/27/imbue-team-trains-70b-parameter-model-from-scratch-innovations-in-pre-training-evaluation-and-infrastructure-for-advanced-ai-performance/@龙龙鱼鱼