「OtterHD：高分辨率多模态模型」链接：https://-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

每日值得看

2 年前

trueeverydaynews

「OtterHD：高分辨率多模态模型」
链接：https://arxiv.org/abs/2311.04219v1
在本文中，我们介绍了OtterHD-8B，这是一个创新的多模型模型，是从Fuyu-8B进化而来，专门用于以精确的粒度解释高分辨率的视觉输入。与受到固定大小视觉编码器约束的传统模型不同，OtterHD-8B能够处理灵活的输入尺寸，确保其在各种推理需求中的多功能性。除了该模型外，我们还介绍了MagnifierBench，这是一个评估框架，旨在审查模型识别小物体的微小细节和空间关系的能力。我们的比较分析显示，尽管当前领先的模型在这个基准测试上表现不佳，但是OtterHD-8B，特别是在直接处理高分辨率输入时，表现比其他模型更好。这些发现揭示了不同模型之间视觉信息处理的结构差异，以及视觉编码器的预训练分辨率差异对模型在此类基准测试中有效性的影响。我们的研究强调了大型多模型模型中的灵活性和高分辨率输入能力的关键作用，也展示了Fuyu架构在处理复杂视觉数据方面的潜力和简单性。

AI资讯

CSDN App 扫码分享

分享

评论

点赞

打赏

复制链接
举报

下一条：

百亿量化私募高薪急招C++！秋招/校招/社招，21/22/23/24届都可 base北上杭深现招岗位:C++量化系统开发工程师年base40-80万+bonus 通过这里找到我 slam_pan 工作职责 1. 参与交易平台的设计、开发与测试，实现交易策略、风控等需求； 2. 开发交易接口与行情接口，完成与关联机构的对接； 3、底层架构以及基础模块设计与开发。任职要求 1、本硕985或优秀本科985应届，计算机相关专业 2、有相关cpp工作经验优先 3、有一线互联网公司或国际顶尖量化公司工作经验的候选人优先考虑； 4、编程基本功扎实，熟练C/C++开发语言、常用算法和数据结构； 5、熟悉TCP/UDP网络协议及相关编程、进程间通讯编程； 6、全面、扎实的软件知识结构，掌握操作系统、数据结构、网络等专业知识； 7、了解分布式系统设计与开发、负载均衡技术，系统容灾设计，高可用系统等知识； #千象资产#世纪前沿私募基金#启林投资#呈瑞投资#灵均投资#思勰投资 #幻方#明汯#九坤#鸣石#天演#进化论#佳期#量化研究员#C++ #机器学习#量化市场#量化期权#量化交易岗 #量化可转债研究员#深圳#上海#北京#香港#杭州#应届 #C++ #求职# #捞 #大厂 #春招 #秋招 #腾讯 #北京大学 #清华大学