热门

最新

红包

立Flag

投票

同城

我的

发布
devhero
op7418
2 年前
truedevhero

AI2 推出了 Molmo 完全开源的多模态LLM。

他们这个图片标注的功能非常好,不止可以语言描述位置和数量还会在图片上标出来。

在学术基准和人类评估上几乎达到了 GPT-4V 的性能。

发布的模型包括MolmoE-1B、Molmo-7B-O、Molmo-7B-D、Molmo-72B。

同时还会开源他们的多模态训练数据集 PixMo。

CSDN App 扫码分享
分享
5
57
  • 复制链接
  • 举报
下一条:
我越是试验OpenAI的o1-preview模型,就越意识到这个模型并不适合用在聊天界面中。但在代理工作流程中,用它可以构建出相当惊人的东西。我注意到它经常忽略类人指令,但在得到额外反馈(无论是手动的还是通过代理流程)后,它解决复杂问题毫无问题。随着这个新模型的推出,情况有所改变,但这是一个自然的过渡。
立即登录