热门

最新

红包

立Flag

投票

同城

我的

发布
m0_46163918
程序员的店小二
2 年前
truem0_46163918

ReSyncer:一个多功能统一模型

可以同时实现音视频口型同步、说话风格迁移和换脸等多种功能。

可以根据音频、视频驱动生成与说话声音同步的嘴型视频,还可以将一个人的说话风格(如语气、节奏)迁移到另一个人身上。

甚至还支持高质量的人脸交换功能, 可以在视频中替换说话者的面部,同时保持嘴部动作、表情与音频的同步。

测试结果与现有的开源方法和Heygen等先进产品对比,有着最低的误差,其嘴型同步的精确度更高。

在换脸任务中,ReSyncer不仅能够保留目标身份的特征,还能实现更自然的表情和嘴型同步,使得换脸效果更加逼真。

展示了其在创建高质量虚拟人脸视频方面的强大能力。

项目地址:
https://guanjz20.github.io/projects/ReSyncer/

AI资讯
CSDN App 扫码分享
分享
评论
1
打赏
  • 复制链接
  • 举报
下一条:
每周,我们都会重点介绍 @爱吃萝卜丸子汤 的论文!✨请查看由 @七231fsda月_x0001_~、@宇哥讲电影 和 Djork-Arné Clevert 撰写的《使用等变图注意力机制进行生物分子结构的表征学习》!https://proceedings.mlr.press/v198/le22a/le22a.pdf
立即登录