「MVDream：一种多视角扩散模型，能够生成与给定文本提示-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

程序员的店小二

3 年前

truem0_46163918

「MVDream：一种多视角扩散模型，能够生成与给定文本提示相符的多视角图像」

MVDream模型就像一台智能相机，能够根据你给出的文字描述生成多视角的图像。这些图像在几何结构上是一致的，也就是说，不论从哪个角度观看，都不会有扭曲或不一致的现象。

这种能力使得该模型在3D模型生成或者从2D图片生成3D模型等应用场景中具有很高的价值。

举例解释：

这就像你有一台智能相机，你告诉它“我想看一辆红色的汽车”。这个相机不仅给你一张红色汽车的照片，而且还能给你从各种各样的角度拍摄的照片——比如从前面看、从侧面看、从上面看等等。而且，无论你从哪个角度看这些照片，那辆红色的汽车都看起来是“对的”，没有任何奇怪的扭曲或变形。

模型结合了预训练的图像扩散模型和从3D模型渲染出的多视角数据集。这种结合使模型既具有广泛的应用性，也能保证从不同角度看到的图像在几何上是一致的。

该模型可以作为3D生成的多视角先验，也可以改善现有的从2D图像到3D模型的转换方法。模型还可以进行微调，以生成特定用户或应用场景下的3D模型。

项目地址：https://mv-dream.github.io/index.html

论文：https://arxiv.org/abs/2308.16512

演示：https://mv-dream.github.io/test_0.html

GitHub：https://github.com/MV-Dream/MVDream

文章转载自互联网的那些事 https://weibo.com/u/1627825392

AI资讯

CSDN App 扫码分享

分享

评论

1

打赏

复制链接
举报

下一条：

「Recipe-p.com : 一个AI图像平台，专门提供AI生成的人像图片」提供的AI生成的人像图像是免费和可编辑的，你可以在其图库里面找到你需要的图片，在这个基础上进行更改和调整以适应你的具体需求。由于这些都是AI生成的图片，你在使用的过程中无需担心版权或许可问题。地址：https://snapby.ai/index.html