热门

最新

红包

立Flag

投票

同城

我的

发布
techsavvyarankomatsuzaki
KKyujin_
1 年前
truetechsavvyarankomatsuzaki

VideoLLM-online: 在线视频大语言模型用于流媒体视频

第一个流媒体视频大语言模型,在长视频(10分钟)上具有高速度(在RTX 3090 GPU上为5~10 FPS,在A100 GPU上为10~15 FPS),在在线/离线设置下具有最先进的性能

项目链接:
https://showlab.github.io/videollm-online/
摘要链接: https://arxiv.org/abs/2406.11816

CSDN App 扫码分享
分享
评论
10
  • 复制链接
  • 举报
下一条:
揭示无编码器的视觉语言模型实现了编码器基础的视觉语言模型和仅解码器视觉语言模型之间更小的性能计算差距https://arxiv.org/abs/2406.11832
立即登录