热门
最新
红包
立Flag
投票
同城
我的
发布
KKyujin_
1 年前
truetechsavvyarankomatsuzaki
揭示无编码器的视觉语言模型
实现了编码器基础的视觉语言模型和仅解码器视觉语言模型之间更小的性能计算差距
https://arxiv.org/abs/2406.11832
下一条:
将VQGAN的码本大小扩展到100,000,利用率达99%在重建、分类和生成等多种任务中表现出色repo:
https://github.com/zh460045050/VQGAN-LC
abs:
https://arxiv.org/abs/2406.11837
立即登录