VideoAnydoor 是一个创新的零样本视频对象插入框架,它能够在不进行任务特定微调的情况下,将特定对象无缝地插入到给定视频中,并精确控制其运动和位置。这项技术由香港大学、阿里巴巴达摩院等的研究人员共同开发,其核心在于高保真细节保留和精确运动控制。
X-Portrait是一种创新的条件扩散模型,专为生成富有表现力且时间连贯的肖像动画而设计。
CoTracker3是一种由Meta AI推出的新一代视频点追踪模型,旨在提高视频中像素级目标的追踪效果。
MIMO AI 是阿里巴巴集团智能计算研究所推出的一种新型可控角色视频合成框架。它基于空间分解建模技术,将2D视频转换为3D空间代码,实现对角色、动作和场景的精确控制。
Follow-Your-Canvas 是一种由腾讯混元团队开发的视频扩展技术,旨在将现有视频内容扩展到更高的分辨率,并在扩展区域生成丰富的新内容。
MotionCtrl是一种统一且灵活的视频生成运动控制器,由腾讯、中国香港大学等机构的研究人员推出。它专为AI视频生成设计,能够独立有效地管理视频中的相机运动和物体运动。
Tora是阿里巴巴集团推出的一款AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术。它能够整合文本、视觉和轨迹数据,精确控制视频内容的动态变化,并生成高质量且符合物理世界动态的视频内容。
Stable Video 4D(SV4D)是Stability AI推出的一款创新性4D视频生成模型,基于Stable Video Diffusion(SVD)和Stable Video 3D(SV3D)开发。该模型的主要功能是将单一视角的视频转换为多个新视角的视频,从而生成一个四维图像矩阵。