腾讯开源了利用人像照片生成视频的模型 V-Express。不知道为啥,项目演示页面的视频都挂了,看不了效果。通过一系列逐步丢弃操作来平衡不同控制信号的简单方法。通过我们的方法,较弱的信号逐渐能够发挥作用,从而实现同时兼顾姿态、输入图像和音频的生成能力。