热门

最新

红包

立Flag

投票

同城

我的

发布
techsavvyak
_akhaliq
2 年前
truetechsavvyak

Google推出PaliGemma

一个多功能的3B VLM用于迁移

PaliGemma是一个基于SigLIP-So400m视觉编码器和Gemma-2B语言模型的开源视觉语言模型(VLM)。它被训练成一个多功能和广泛知识的基础模型,能够有效用于迁移。它在各种开放世界任务中表现出色。我们在近40个多样化的任务上评估了PaliGemma,包括标准的VLM基准测试,还包括更专业的任务,如遥感和分割。

CSDN App 扫码分享
分享
2
32
  • 复制链接
  • 举报
下一条:
多模态微调将把许多最难的AI用例带入可能的领域。接下来的6个月到1年将会非常棒。
立即登录