Boximator：通过双重盒子约束，精确控制视频中对象的位-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

程序员的店小二

7 月前

truem0_46163918

Boximator：通过双重盒子约束，精确控制视频中对象的位置、形状或运动路径。

Box分为两种，软盒子和硬盒子，硬盒子用于精确定位，而软盒子用来控制对象在指定区域内自由移动。

使用Boximator，你可以指定一个对象在视频的开始和结束时应该在哪里，以及它应该如何移动。

Boximator的主要工作原理：

通过两种类型的“盒子”（硬盒子和软盒子）允许用户精确控制视频中对象的位置、形状或运动路径。

硬盒子用于精确定位，而软盒子提供了更大的灵活性，允许对象在指定区域内自由移动。

1、双重盒子约束：

使用硬盒子（Hard Box）：在视频的起始帧，用户通过硬盒子精确地标出对象的初始位置和大小。这些硬盒子为视频合成提供了明确的起点。

设定目标状态：用户同样可以在视频的某个特定帧（通常是结束帧）使用硬盒子来指定对象应到达的位置和大小，定义对象的目标状态。

应用软盒子（Soft Box）：软盒子用来描述对象在视频中运动的大致范围或路径。它们不像硬盒子那样精确，但提供了对象在两个硬盒子约束之间移动时的自由度。

运动控制：通过在视频的不同帧之间设置软盒子，用户可以大致控制对象的移动路径。例如，可以通过在中间帧中设置软盒子来指导对象移动的方向和范围。

2、自我跟踪学习机制：

为了解决模型学习盒子和对象关系的难题，Boximator采用了自我跟踪的技术。通过这种方式，即使在视频的后续帧中没有直接的用户定义盒子，Boximator也能够预测对象的运动，确保对象按照用户的初衷移动。

基于用户定义的盒子约束和模型的自我跟踪学习，Boximator生成符合预期的对象运动和动作，实现从初始状态到目标状态的平滑过渡。

3、视频合成：

整合对象运动：在视频合成过程中，Boximator综合考虑硬盒子和软盒子的约束，以及模型对对象运动的预测，生成包含用户指定动作的视频。

优化和调整：用户可以根据初步生成的视频效果，调整盒子的位置、大小或运动路径，以进一步优化视频中的动作表现。

项目及演示：https://boximator.github.io
论文：https://arxiv.org/abs/2402.01566
GitHub：coming soon...
视频介绍：https://youtube.com/watch?v=reto_TYsYyQ

AI资讯

CSDN App 扫码分享

分享

评论

1

打赏

复制链接
举报

下一条：

【明晚CSDN直播推荐】Vector-CSM在高压安全测量方向提供的产品及方案立即预约：https://polelink.csdn.net/65c2f1a0dafaf23eeaee8580.html本次直播将会为大家介绍Vector-CSM在高压安全测量方向提供的产品及方案，以及在新能源汽车开发中的应用。主讲人介绍本期主讲人是来自维克多中国测量技术产品组的商务开发经理李峂。公司相关业务介绍Vector Informatik公司成立于1988年，总部位于德国汽车工业中心斯图加特，是全球领先的分布式系统设计开发工具、网络节点测试验证工具和嵌入式软件组件提供商，为ECU的开发、测试、标定和诊断等过程提供一系列强有力的软硬件工具和组件，在全球范围内，来自汽车、商用车、工程机械和控制工程领域的客户都在应用Vector提供的解决方案和产品。CSM Computer-Systeme-Messtechnik GmbH公司成立于1984年，自2015年起与Vector结为战略合作伙伴，其研制的高精度、紧凑、可靠的移动测量模块和数据记录仪被全球知名的汽车、卡车、特种车辆、拖拉机、工程机械、轨道车辆制造商及其供应商和服务提供商广为使用。