热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_36209030
ChingKitWong
2 年前
trueweixin_36209030

👏我们刚刚推出了NeedleBench——一个框架,包括一系列逐渐更具挑战性的任务,用于评估双语长上下文能力,涵盖多个长度区间(4k、8k、32k、128k、200k、1000k及更长)和不同深度范围。

💡所有代码和资源均可在此获取:
https://github.com/open-compass/opencompass

👁️论文:https://arxiv.org/pdf/2407.11963

CSDN App 扫码分享
分享
评论
点赞
  • 复制链接
  • 举报
下一条:
🎉恭喜!💡Open VLM排行榜访问量已达50万次!@一唯科技👁️更多信息,请参阅HF:https://huggingface.co/spaces/opencompass/open_vlm_leaderboard
立即登录