我们将数据集拆分为测试和训练字幕。测试集用于评估视频生成模型-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

2 年前

truedevhritik

我们将数据集拆分为测试和训练字幕。测试集用于评估视频生成模型。训练集用于训练自动评估模型。我们请人类标注员判断生成的视频是否符合物理常识和语义一致性 🫅

CSDN App 扫码分享

分享

7

78

复制链接
举报

下一条：

然后，我们从各种开放和封闭的文本到视频（T2V）模型生成了视频。具体来说，我们的研究包括 Pika (@土谢图汗奥巴)、Lumiere (@卢勃)、Gen-2 (@skydogliQWQ)、Stable Video Diffusion (@好困好困STA)、OpenSora、VideoCrafter2、ZeroScope 和 LaVIE。