ReSyncer：一个多功能统一模型可以同时实现音视频口型同-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

程序员的店小二

2 年前

truem0_46163918

ReSyncer：一个多功能统一模型

可以同时实现音视频口型同步、说话风格迁移和换脸等多种功能。

可以根据音频、视频驱动生成与说话声音同步的嘴型视频，还可以将一个人的说话风格（如语气、节奏）迁移到另一个人身上。

甚至还支持高质量的人脸交换功能，可以在视频中替换说话者的面部，同时保持嘴部动作、表情与音频的同步。

测试结果与现有的开源方法和Heygen等先进产品对比，有着最低的误差，其嘴型同步的精确度更高。

在换脸任务中，ReSyncer不仅能够保留目标身份的特征，还能实现更自然的表情和嘴型同步，使得换脸效果更加逼真。

展示了其在创建高质量虚拟人脸视频方面的强大能力。

项目地址：https://guanjz20.github.io/projects/ReSyncer/

AI资讯

CSDN App 扫码分享

分享

评论

1

打赏

复制链接
举报

下一条：

每周，我们都会重点介绍 @爱吃萝卜丸子汤的论文！✨请查看由 @七231fsda月_x0001_~、@宇哥讲电影和 Djork-Arné Clevert 撰写的《使用等变图注意力机制进行生物分子结构的表征学习》！https://proceedings.mlr.press/v198/le22a/le22a.pdf