在论文《看看、记住并推理:通过语言模型进行视频中的基础推理》中,我们着手解决视频理解任务中因果或组合时空推理的挑战。点击这里了解论文详情:https://openreview.net/forum?id=jhPvuc7kxB