热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_40912980
exploit-cat
2 年前
trueweixin_40912980

将事实与逻辑分开:时间测试(Test of Time,ToT)基准隔离了大型语言模型(LLMs)中的推理能力,以改进其时间理解

快速阅读:
https://www.marktechpost.com/2024/06/17/separating-fact-from-logic-test-of-time-tot-benchmark-isolates-reasoning-skills-in-llms-for-improved-temporal-understanding/

论文: https://arxiv.org/abs/2406.09170

HF 页面: https://huggingface.co/datasets/baharef/ToT

CSDN App 扫码分享
分享
评论
9
  • 复制链接
  • 举报
下一条:
【🌟 参加者们,有激动人心的消息!不要错过@一只硕大的土拨鼠 探讨Agent AI的世界,并加入多模态基础模型的讨论小组。一定要到场哦!🤖 Agent AI 会议:6月18日上午8:30🔍 多模态讨论小组:6月18日上午11:30加入我们,共同度过充满见解的讨论日!🚀】
立即登录