AtomoVideo简介
AtomoVideo是一个由阿里巴巴开发的高保真图像到视频生成框架,其核心技术是多粒度图像注入技术,这使得生成的视频对给定的图像具有更高的保真度。
AtomoVideo项目地址:https://huggingface.co/papers/2403.01800
论文地址:https://arxiv.org/abs/2403.01800
AtomoVideo功能特点
高保真视频生成:AtomoVideo能够从单一静态图像生成高保真的视频序列,确保视频中的内容不仅与原始图片保持高度一致,而且动作自然流畅。
动作强度和连贯性:生成的视频具有自然流畅的动作和良好的时间连贯性,视频中的运动看起来既自然又符合逻辑,没有突兀或不自然的过渡。
运动一致性:视频动作流畅,确保时间上的一致性,不会出现突兀的跳转。
视频帧预测:通过迭代预测后续帧的方式,支持长视频序列的生成。
兼容多种文生图模型:AtomoVideo兼容各种个性化的T2I模型,无需特定调整。
使用预训练的文本到图像(T2I)模型:AtomoVideo使用预先训练好的T2I模型作为基础,并在每个空间卷积和注意力层之后添加新的一维时间卷积和时间注意力模块。
综上所述,AtomoVideo不仅能够生成高保真的视频内容,还具有良好的运动强度和一致性,同时支持多种模型,适用于视频内容创作、个性化视频生成以及长序列视频预测。