为了能够快速迭代和基准测试我们的数据集,我们还在来自9个生成模型的训练提示和视频上训练了VideoCon-Physics(7B)。我们发现,VideoCon-Physics在判断语义一致性和物理常识方面优于Gemini-Pro-Vision-1.5。