EchoMimic - 是由蚂蚁集团研究团队开发的一款先进的人像图像动画模型，旨在通过音频和面部特征点生成逼真的肖像视频

AI视频工具 AI数字人 AI视频工具

EchoMimic

EchoMimic是由蚂蚁集团研究团队开发的一款先进的人像图像动画模型，旨在通过音频和面部特征点生成逼真的肖像视频。

标签：AI对口型 EchoMimic

链接直达手机查看

什么是EchoMimic

EchoMimic是由蚂蚁集团研究团队开发的一款先进的人像图像动画模型，旨在通过音频和面部特征点生成逼真的肖像视频。该技术结合了音频输入和面部标志点（如眼睛、鼻子、嘴巴等关键特征和结构），能够实现高稳定性和自然度的视频效果。

项目地址：https://badtobest.github.io/echomimic.html

Github：https://github.com/BadToBest/EchoMimic

音频驱动：EchoMimic可以单独或结合面部标志点通过音频生成肖像动画视频。这种方法通过分析音频信号，使人物的口型与音频内容同步。

面部标志点编辑：用户可以通过编辑面部标志点来调整生成的视频，从而实现更自然和符合真实面部运动的效果。

高稳定性和自然度：该系统在多个公共数据集和自收集数据集上进行了测试，显示出较高的稳定性和自然度，解决了传统方法在音频驱动时可能的不稳定性以及面部关键点驱动可能导致的不自然结果。

多场景应用：除了基本的音频驱动功能，EchoMimic还支持将音频和表情混用，即通过音频控制口型，进一步增强了其灵活性和适用性。

开源项目：作为一项创新技术，EchoMimic已经由蚂蚁集团开源，供广大开发者和研究人员使用和改进。

在线AI智能换脸

DreamWorld AI是一家专注于人工智能和计算机视觉研究与开发的公司，旨在构建下一代AI驱动的数字人类。

DiffSynth Studio是一款创新的扩散引擎，专为图像和视频合成爱好者设计。用户可以进行AI绘图、长视频合成、图像合成、卡通着色和视频风格化等多种操作。

InstaVerse是一款 AI 生成 3D 场境的工具

必剪Studio是B站推出的一款免费AI数字分身定制和视频创作工具。

什么是Tune-A-VideoTune-A-Video是一种视频生成新技术，它通过一次性调整将预训练的图像扩[…]