热门

最新

红包

立Flag

投票

同城

我的

发布
techsavvyak
_akhaliq
2 年前
truetechsavvyak

论文页面: https://huggingface.co/papers/2407.07726

CSDN App 扫码分享
分享
1
19
  • 复制链接
  • 举报
下一条:
Google推出PaliGemma一个多功能的3B VLM用于迁移PaliGemma是一个基于SigLIP-So400m视觉编码器和Gemma-2B语言模型的开源视觉语言模型(VLM)。它被训练成一个多功能和广泛知识的基础模型,能够有效用于迁移。它在各种开放世界任务中表现出色。我们在近40个多样化的任务上评估了PaliGemma,包括标准的VLM基准测试,还包括更专业的任务,如遥感和分割。
立即登录