热门
最新
红包
立Flag
投票
同城
我的
发布
_akhaliq
2 年前
truetechsavvyak
论文页面:
https://huggingface.co/papers/2407.07726
下一条:
Google推出PaliGemma一个多功能的3B VLM用于迁移PaliGemma是一个基于SigLIP-So400m视觉编码器和Gemma-2B语言模型的开源视觉语言模型(VLM)。它被训练成一个多功能和广泛知识的基础模型,能够有效用于迁移。它在各种开放世界任务中表现出色。我们在近40个多样化的任务上评估了PaliGemma,包括标准的VLM基准测试,还包括更专业的任务,如遥感和分割。
立即登录