字节研究院发布了一个名为 Boximator 的视频控制方式,这是一种用细粒度运动控制来增强视频扩散模型的方法,这种控制方式允许用户选择需要运动的物体,用户可通过固定框选在视频选出基准帧,然后继续明确或精准地定义物体在后续画面里的位置、轮廓或动态路径。与 Runway 的运动笔刷相比,Boximator 可以更精确地控制物体的运动结束位置,Boximator能够作为已有视频编辑工具的增强功能。
线上体验地址:https://boximator.github.io/
项目报告地址:https://arxiv.org/pdf/2402.01566.pdf