热门
最新
红包
立Flag
投票
同城
我的
发布
事实还是虚构?NOCHA:用于评估大型语言模型长上下文推理的新基准
快速阅读:https://www.marktechpost.com/2024/06/27/fact-or-fiction-nocha-a-new-benchmark-for-evaluating-long-context-reasoning-in-llms/
论文:https://arxiv.org/abs/2406.16264
GitHub:https://github.com/marzenakrp/nocha
NOCHA排行榜:https://novelchallenge.github.io/
@笑笑口常开啊 @oping wong
@weixin_31315567
@经年哲思
@你不是我你不行
@三奇贵人
@weixin_34797871
@weixin_29161785
@weixin_31315567
CSDN App 扫码分享
评论
11
- 复制链接
- 举报