热门
最新
红包
立Flag
投票
同城
我的
发布
「MVDream:一种多视角扩散模型,能够生成与给定文本提示相符的多视角图像」
MVDream模型就像一台智能相机,能够根据你给出的文字描述生成多视角的图像。这些图像在几何结构上是一致的,也就是说,不论从哪个角度观看,都不会有扭曲或不一致的现象。
这种能力使得该模型在3D模型生成或者从2D图片生成3D模型等应用场景中具有很高的价值。
举例解释:
这就像你有一台智能相机,你告诉它“我想看一辆红色的汽车”。这个相机不仅给你一张红色汽车的照片,而且还能给你从各种各样的角度拍摄的照片——比如从前面看、从侧面看、从上面看等等。而且,无论你从哪个角度看这些照片,那辆红色的汽车都看起来是“对的”,没有任何奇怪的扭曲或变形。
模型结合了预训练的图像扩散模型和从3D模型渲染出的多视角数据集。这种结合使模型既具有广泛的应用性,也能保证从不同角度看到的图像在几何上是一致的。
该模型可以作为3D生成的多视角先验,也可以改善现有的从2D图像到3D模型的转换方法。模型还可以进行微调,以生成特定用户或应用场景下的3D模型。
项目地址:https://mv-dream.github.io/index.html
论文:https://arxiv.org/abs/2308.16512
演示:https://mv-dream.github.io/test_0.html
GitHub:https://github.com/MV-Dream/MVDream
文章转载自互联网的那些事 https://weibo.com/u/1627825392
AI资讯
CSDN App 扫码分享
评论
1
打赏
- 复制链接
- 举报