VideoReTalking - 基于音频的开源AI唇形同步工具

AI视频工具 AI数字人 AI视频工具

VideoReTalking

VideoReTalking是一个由西安电子科技大学、腾讯人工智能实验室和清华大学联合开发的基于音频的开源AI唇形同步工具

链接直达手机查看

VideoReTalking简介

VideoReTalking是一个由西安电子科技大学、腾讯人工智能实验室和清华大学联合开发的基于音频的开源AI唇形同步工具。它能够根据用户输入的文本或文档内容，实时生成解释性的视频，主要功能包括文本到视频的实时转换、PDF文件等资料的自动视频化汇总以及可持续对话。
此外，VideoReTalking还能让嘴型与声音同步，并根据声音改变视频中人物的表情，整个过程不需要用户干预，都是自动完成的。具备语音转文字、多个音色变换、多个扬声器同时对讲等功能。

VideoReTalking技术的优势在于其强大的声音驱动能力和高度的自动化程度，不需要用户进行复杂的操作，只需要输入音频信号，就可以自动生成与声音相匹配的视频。

相较于传统的AI数字人生成方法，VideoReTalking无需复杂的操作流程和专业的技术知识，用户只需上传视频和音频文件，即可轻松生成高质量的AI数字人。

VideoReTalking Github：https://github.com/OpenTalker/video-retalking

相关导航

AtomoVideo

AtomoVideo是一个由阿里巴巴开发的高保真图像到视频生成框架，其核心技术是多粒度图像注入技术，这使得生成的视频对给定的图像具有更高的保真度。

Vach

Vach是一个开源项目，旨在通过流式数字人技术，实现音视频同步对话，并且已经达到了接近商用的效果。它不仅能够进行文本交互，还能通过语音进行交互，这使得它在多种场景下都具有广泛的应用潜力。

Akool FaceSwap

一款在线换脸工具

Vega AI

Vega AI是国内人工智能初创公司右脑科技（RightBrain AI）推出的在线训练应用AI图片创作平台，是一款免费的AI绘画创作工具，支持在线训练AI绘画模型，支持文生图，图生图，条件生图等多种绘画模式。

LeiaPix

LeiaPix是一个免费的图片转视频的工具，它可以利用人工智能技术，把你的2D照片变成3D照片

Pyramid-Flow

Pyramid-Flow是一种由北京大学、快手科技和北京邮电大学联合开发的开源AI视频生成模型。该模型能够根据文本提示生成长达10秒、分辨率高达1280x768、帧率24帧每秒的高清视频。