热门
最新
红包
立Flag
投票
同城
我的
发布
海瑞克
2 年前
truedevhritik
我们将数据集拆分为测试和训练字幕。测试集用于评估视频生成模型。训练集用于训练自动评估模型。我们请人类标注员判断生成的视频是否符合物理常识和语义一致性 🫅
下一条:
然后,我们从各种开放和封闭的文本到视频(T2V)模型生成了视频。具体来说,我们的研究包括 Pika (@土谢图汗奥巴)、Lumiere (@卢勃)、Gen-2 (@skydogliQWQ)、Stable Video Diffusion (@好困好困STA)、OpenSora、VideoCrafter2、ZeroScope 和 LaVIE。
立即登录