热门

最新

红包

立Flag

投票

同城

我的

发布
techsavvyarankomatsuzaki
KKyujin_
2 年前
truetechsavvyarankomatsuzaki

InternLM-XComposer-2.5: 一个多功能的大型视觉语言模型,支持长上下文输入和输出

- 在各种文本-图像任务中表现出色,具备类似GPT-4V的能力,仅使用7B LLM后端
- 开源

https://arxiv.org/abs/2407.03320

CSDN App 扫码分享
分享
1
18
  • 复制链接
  • 举报
下一条:
《研究仅解码器的大型语言模型用于语音到文本翻译》,作者:Chao-Wei Huang, Hui Lu, Hongyu Gong, Hirofumi Inaguma, Ilia Kulikov, Ruslan Mavlyutov, Sravya Popuri,https://ift.tt/r2t0Gk4
立即登录