热门

最新

红包

立Flag

投票

同城

我的

发布
weixin_37992011
imxiaohu
1 年前
trueweixin_37992011

Video-MME: 首个多模态大模型视频分析综合评估基准

该基准由来自多个大学和研究机构的研究人员共同开发,旨在通过多样化和高质量的数据集,全面考察MLLMs在处理视频数据时的能力。

视频数据集涵盖6个主要视觉领域,包括知识、电影与电视、体育竞技、艺术表演、生活记录和多语言。

每个领域进一步细分为30个子类别,如天文学、科技、纪录片、新闻报道、电竞、魔术表演和时尚等,确保广泛的场景适用性。

CSDN App 扫码分享
分享
1
20
  • 复制链接
  • 举报
下一条:
我们即将推出新东西。这个星期四。https://www.youtube.com/watch?v=44vi31hehw4&ab_channel=HuggingFace
立即登录