AI数字人 | AIUG

INFP

字节跳动的数字人项目——INFP，是一个基于音频驱动的交互式数字人生成框架，旨在解决二元对话中自然角色切换与逼真交互式视频生成的问题。

JoyVASA

JoyVASA是京东健康国际公司开源的一个音频驱动的数字人头项目，基于扩散模型技术，能够根据音频信号生成与音频同步的面部动态和头部运动。

JoyHallo

JoyHallo是一款由京东推出的数字人模型，专为普通话视频生成而设计。该模型能够根据音频生成逼真的说话视频，特别适合处理普通话的复杂口型和语调。

HeadGAP

HeadGAP是一种由字节跳动和上海科技大学共同开发的3D头像生成模型，能够从少量甚至单张目标人物的图片中快速创建出逼真且可动画化的3D头像。

CyberHost

CyberHost是一个端到端音频驱动的人类动画框架，能够确保手的完整性、身份的一致性和自然的运动。

LOOPY

LOOPY是由字节跳动和浙江大学的科研团队联合开发的一款基于音频驱动的视频扩散模型，旨在利用数据中的长期运动信息学习自然运动模式，提高音频与肖像运动的相关性，从而生成更逼真、高质量的肖像视频。

Canva AI

Canva AI是Canva平台推出的一系列基于人工智能的设计工具，旨在帮助用户更轻松地创建专业水准的设计作品。

DeepLiveCam

DeepLiveCam是一款开源的AI实时换脸和视频深伪工具，它结合了多种技术，能够实现高精度的人脸替换和深度伪造。

ER-NeRF

ER-NeRF是一种基于NeRF（神经辐射场）的新型数字人生成技术，主要用于生成高保真度的动态头部重建和实时渲染。ER-NeRF在多个方面进行了改进和优化，使其在数字人模型生成中表现出色。

ReHiFace-S

ReHiFace-S 是由硅基智能创建的实时高保真换脸算法，其全称为“Real Time High-Fidelity Faceswap”。该项目通过开源数字人生成功能，允许开发者轻松生成大规模的数字人，并实现视频中脸部的实时替换。

StyleSync

StyleSync是一种高保真、通用和个性化的唇形同步框架，主要基于风格的生成器来实现精确的口型同步。

Video-ReTalking

Video-ReTalking是一种基于AI的创新技术，主要用于实现视频中人物嘴型与输入声音的同步。这项技术可以自动调整视频中人物的嘴型和表情，使其与音频内容完全匹配，并且能够生成高质量、自然的输出视频。

ReSyncer

ReSyncer是一个由清华大学、百度公司、中关村实验室和南洋理工大学的研究人员共同推出的新技术框架，用于创建统一的音频-视觉同步的面部表演者系统。ReSyncer不仅可以实现更高稳定性和质量的口型同步，而且还支持创建虚拟表演者所必需的各种有趣属性，包括快速个性化微调、视频驱动的口型同步、说话风格的转换，甚至换脸。