热门

最新

红包

立Flag

投票

同城

我的

发布
techsavvyarankomatsuzaki
KKyujin_
2 年前
truetechsavvyarankomatsuzaki

字节跳动推出了可视化自回归建模:通过下一尺度预测实现可扩展图像生成

VAR在Imagenet 256x256的AR基线上取得了显著提升,将FID改善至1.80,并且推理速度提高了20倍

项目:
https://var.vision/
摘要:https://arxiv.org/abs/2404.02905

CSDN App 扫码分享
分享
3
112
  • 复制链接
  • 举报
下一条:
🚀 博客【粉丝量】突破【26500】啦~,继续加油~
立即登录