HeadGAP是一种由字节跳动和上海科技大学共同开发的3D头像生成模型,能够从少量甚至单张目标人物的图片中快速创建出逼真且可动画化的3D头像。
什么是DrawingSpinUpDrawingSpinUp是一种先进的3D动画生成技术,能够将单一平面2D角[…]
Champ AI是一款由阿里巴巴集团、复旦大学和南京大学联合研发的3D人体动画技术,旨在将静态人物图片转换为动态视频动画。该技术通过精确捕捉和再现人体的形状和动作,创造出既真实又可控的动态视觉内容。
Mootion是一个创新的AI原生3D动画创作平台,利用人工智能技术简化和加速3D动画的制作过程。
Diffusion4D是由多伦多大学,北京交通大学,德克萨斯大学奥斯汀分校和剑桥大学团队最新提出的4D生成扩散模型,
AnimationGPT是一个基于文本生成格斗风格角色动作的工具。它主要应用于游戏开发、动画制作和虚拟现实等领域,能够为角色设计和生成各种攻击、防御动作,提升动画制作的效率,并生成逼真、自然的角色动作以增强沉浸式体验。
Wonder Studio是一款专注于AI人工智能的工具,它能够自动将计算机生成(CG)角色动画和光照效果合成到实际场景中。
Stable Video 3D是Stability AI 推出的3D 视频生成大模型,该模型还支持从文本或图像提示生成3D视频。
AnimatableDreamer是清华系创业团队生数科技联合清华大学、同济大学等高校推出全球首个基于「骨骼动画」的 4D 动画生成框架,能够直接将 2D 视频素材一键转成动态立体模型(即 4D 动画),支持自动提取骨骼动作、一键转换动画效果并可通过文字输入进行个性化角色生成。
构建面向 3D、视频、动画、游戏等的 AI 驱动型创意中心
可以帮助用户快速生成高质量的概念艺术作品。
以将视频转化为3D动画
支持一句话生成超逼真的3D数字人
InstaVerse是一款 AI 生成 3D 场境的工具
ConsisID文生视频模型是一种基于人工智能技术的视频生成工具,通过参考角色图片,能够将文本描述转化为高质量的视频内容。
DimensionX是一个由中国香港科技大学、清华大学和生数科技共同推出的创新框架,旨在通过单张图片生成逼真的3D和4D场景。
X-Portrait是一种创新的条件扩散模型,专为生成富有表现力且时间连贯的肖像动画而设计。
Meta Movie Gen是由Meta公司推出的一款先进的AI视频和音频生成模型。它能够通过简单的文本输入生成高质量的视频和音效,并支持精准的视频编辑功能。
PhysGen是一种创新的图像到视频生成方法
PortraitGen是由中国科学技术大学推出的一款创新AI人像视频编辑工具,旨在将2D人像视频提升为4D效果。
DynaCrafter AI 是由中国香港中文大学、腾讯 AI Lab和北大团队联合研发的一种文字生成视频的 AI 模型。该模型能够将静态图像转化为逼真的动态视频,开创了视觉内容创造和动态化的新领域。
Seaweed AI 是字节跳动旗下火山引擎推出的一款人工智能视频生成工具,属于豆包视频生成系列的一部分。该模型主要面向企业市场。
PixelDance是由字节跳动开发的一款高动态视频生成模型,它结合了文本指令和图像指令来生成视频内容。该模型基于扩散模型,通过模拟数据的扩散过程来生成新的数据样本。
ControlNeXt是一个高效、灵活且易于使用的可控生成框架,旨在实现图像和视频的多样化控制。该框架由中国香港中文大学和商汤科技联合开发,适用于广泛的图像和视频生成任务,特别适合需要精细控制生成内容的应用场景。
MotionCtrl是一种统一且灵活的视频生成运动控制器,由腾讯、中国香港大学等机构的研究人员推出。它专为AI视频生成设计,能够独立有效地管理视频中的相机运动和物体运动。
Tora是阿里巴巴集团推出的一款AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术。它能够整合文本、视觉和轨迹数据,精确控制视频内容的动态变化,并生成高质量且符合物理世界动态的视频内容。
Vidu是由生数科技与清华大学联合开发的视频大模型
清影是智谱AI推出的一款基于人工智能技术的视频生成工具,旨在通过自研的CogVideo大模型实现文本到视频、图片到视频的智能生成。
EasyAnimate是一个功能强大的图生视频和文生视频生成工具,还支持上传两张图片作为视频的起始和结束画面,实现更灵活的视频编辑,最长支持1分钟视频生成,提供了完整的高清长视频生成解决方案。
MimicMotion是由腾讯公司与上海交通大学联合推出的一款创新性的人工智能人像动态视频生成框架。
SMooDi AI,即Stylized Motion Diffusion Model,是一种新颖的风格化运动扩散模型。它的核心优势在于其能够将文本描述转化为具有特定风格的运动序列。
Still-Moving是Google推出的一项创新技术,旨在通过静态图像来定制和生成视频。这一技术无需任何定制化的视频数据,能够将个性化或风格化的静态图像转换成具有自然运动特性的视频
LivePortrait是一款基于AI技术的肖像动画工具,能够从单一静态图像生成生动的动态视频。该工具特别适合需要快速生成高质量肖像动画的创作者和设计师。
寻光是由阿里达摩院推出的一站式AI视频创作平台,旨在通过人工智能技术提供全新的视频创作模式,重塑传统视频制作的全流程。
ExVideo是由华东师范大学和阿里巴巴集团的研究人员共同开发的一项创新性的视频合成后调整技术。
MagicPose是南加州大学&字节提出的一种新颖有效的方法,提供逼真的人类视频生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
VideoLingo 是一款一站式视频翻译本地化配音工具,旨在生成 Netflix 级别的高质量字幕,告别生硬机翻,告别多行字幕,还能加上高质量的配音,让全世界的知识能够跨越语言的障碍共享。
Linly-Dubbing是一款多语言 AI 配音及视频翻译工具,基于 YouDub-webui 的灵感进行了创新性的拓展和优化。
PyVideoTrans是一个功能强大的视频翻译配音工具。 它能够将一种语言的视频自动翻译为另一种语言,并添加与之匹配的字幕和配音。
通义听悟是阿里云推出的一款工作学习AI助手,旨在帮助用户高效记录和阅读音视频内容。该产品基于阿里云通义千问大模型开发,具备多种功能,包括语音识别、说话人分离、翻译、内容抽取等。通义听悟支持多种语言和场景,适用于会议记录、咨询访谈、语音同传、摘要生成、面试记录、视频打标等应用场景。
Clipfly是一个功能全面、易于使用的在线视频编辑工具,特别适合需要快速、高效地编辑和制作视频内容的用户。无论是个人用户还是商业用户,都可以从Clipfly中获得所需的编辑工具和创意元素,以满足不同的视频创作需求。
ElevenLabs Dubbing的多语言语音合成、声音克隆、文本和音频处理技术,可以把任意一段音频或者视频,快速翻译为包括中文、葡萄牙语、日语等在内的29种语言,同时保留原语音者的音色特征和情感。
讯飞智能翻译是由科大讯飞推出的一个快速准确、稳定可靠的人工智能翻译平台,支持超过140多种语言间进行互译,并提供文档翻译、文本翻译、语音翻译、图片翻译、网页翻译、视频翻译、音频翻译等多种翻译模式。
阿里翻译是由阿里巴巴提供的多语种在线实时翻译网站,支持多种领域、覆盖200+语言的智能机器翻译服务。阿里翻译还支持文档翻译、图片翻译、视频翻译、语音翻译等多模态翻译能力。
火山翻译是字节跳动旗下企业级技术服务平台火山引擎的核心AI中台能力之一,由北京火山引擎科技有限公司开发,依托百亿语料数据积累和前沿技术创新,提供多语种、多领域翻译技术与服务。火
多语言语音合成、声音克隆、文本和音频处理技术,可以把任意一段音频或者视频,快速翻译为包括中文、葡萄牙语、日语等在内的29种语言,同时保留原语音者的音色特征和情感
DeepLiveCam是一款开源的AI实时换脸和视频深伪工具,它结合了多种技术,能够实现高精度的人脸替换和深度伪造。
ReHiFace-S 是由硅基智能创建的实时高保真换脸算法,其全称为“Real Time High-Fidelity Faceswap”。该项目通过开源数字人生成功能,允许开发者轻松生成大规模的数字人,并实现视频中脸部的实时替换。
ReSyncer是一个由清华大学、百度公司、中关村实验室和南洋理工大学的研究人员共同推出的新技术框架,用于创建统一的音频-视觉同步的面部表演者系统。ReSyncer不仅可以实现更高稳定性和质量的口型同步,而且还支持创建虚拟表演者所必需的各种有趣属性,包括快速个性化微调、视频驱动的口型同步、说话风格的转换,甚至换脸。
Rope换脸软件是一款免费开源的AI换脸工具,处理速度快,支持多种换脸模式,实时预览换脸状态,多种遮罩模式,多人脸融合换脸,无需数据集与训练
什么是Roop-unleashedRoop-unleashed是一款基于AI的换脸软件,它是Roop项目的衍[…]
Reface是一个AI驱动的应用程序,专门用于在图像和视频中换脸。它允许用户将他们的脸叠加到其他形式的媒体上,从而创造个性化的视觉体验。
DeepFaceLive是一个提供实时换脸功能的工具,适用于PC流媒体或视频通话。
Deepfakesweb作为一个在线深度AI伪造生成器,允许用户使用人工智能技术轻松创建逼真的深度伪造视频,操作简单方便。
Deepswap是一个在线AI换脸应用,允许用户生成换脸视频、照片和GIF。它以其先进的AI技术而闻名,可以制作高质量和逼真的换脸效果。
Swapface是一个实时换脸的视频通话工具,使用先进的机器学习模型来精确检测和替换用户的视频流中的脸。
FaceFusion是一款功能全面、操作简便的AI换脸和增强工具,适用于各种创意和娱乐应用场景,尤其适合追求高质量图像效果的用户。
在线AI智能换脸
一款在线AI换脸应用,可用于视频、照片和GIF
一款在线换脸工具
一键生成换脸视频
JoyVASA是京东健康国际公司开源的一个音频驱动的数字人头项目,基于扩散模型技术,能够根据音频信号生成与音频同步的面部动态和头部运动。
JoyHallo是一款由京东推出的数字人模型,专为普通话视频生成而设计。该模型能够根据音频生成逼真的说话视频,特别适合处理普通话的复杂口型和语调。
CyberHost是一个端到端音频驱动的人类动画框架,能够确保手的完整性、身份的一致性和自然的运动。
LOOPY是由字节跳动和浙江大学的科研团队联合开发的一款基于音频驱动的视频扩散模型,旨在利用数据中的长期运动信息学习自然运动模式,提高音频与肖像运动的相关性,从而生成更逼真、高质量的肖像视频。
什么是CanvaAICanvaAI是Canva平台推出的一系列基于人工智能的设计工具,旨在帮助用户更轻松[…]
ER-NeRF是一种基于NeRF(神经辐射场)的新型数字人生成技术,主要用于生成高保真度的动态头部重建和实时渲染。ER-NeRF在多个方面进行了改进和优化,使其在数字人模型生成中表现出色。
StyleSync是一种高保真、通用和个性化的唇形同步框架,主要基于风格的生成器来实现精确的口型同步。
Video-ReTalking是一种基于AI的创新技术,主要用于实现视频中人物嘴型与输入声音的同步。这项技术可以自动调整视频中人物的嘴型和表情,使其与音频内容完全匹配,并且能够生成高质量、自然的输出视频。
EmoTalk3D是一个专注于3D虚拟人头合成的数字人框架,旨在解决传统3D人头合成中视角一致性和情感表达不足的问题。
Vimi是商汤科技推出的一款可控人物视频生成AI模型,基于其强大的日日新大模型能力。该产品主要面向C端用户,能够通过动作视频、动画、声音和文字等多种驱动元素来生成与目标动作一致的人物类视频。
Hedra一款由斯坦福大学研究团队倾力打造的AI对口型视频生成神器,它结合前沿的人工智能技术,能够将文本、图片和语音转化为高度逼真的动态视频。无论是真人还是动漫,甚至是物品,Hedra都能通过你上传的音频生成匹配的口型!
EchoMimic是由蚂蚁集团研究团队开发的一款先进的人像图像动画模型,旨在通过音频和面部特征点生成逼真的肖像视频。
DreamAvatar是由美图公司开发的一款AI数字人生成工具,旨在通过人工智能技术帮助用户快速创建逼真、个性化和多样化的数字人形象。
Fay是一个完整的AI数字人开源项目,包含Fay控制器及数字人模型。它提供了灵活的模块化设计,使开发人员能够定制和组合各种功能模块,包括情绪分析、NLP处理、语音合成和语音输出等。
DUIX 是由硅基智能开发的数字人智能交互平台,开源的2D真人级、AIGC实时渲染数字人模型,支持在Android和iOS设备上快速部署。
Hallo是一款AI 对口型肖像视频生成框架。全新的AI图片数字人,上传一张照片即可让照片开口说话。
InstructAvatar是一个创新的头像生成模型,它通过自然语言的引导,允许用户对2D头像的情感和面部动作进行精细控制。
Vach是一个开源项目,旨在通过流式数字人技术,实现音视频同步对话,并且已经达到了接近商用的效果。它不仅能够进行文本交互,还能通过语音进行交互,这使得它在多种场景下都具有广泛的应用潜力。
SyncTalk可以合成同步说话的头像视频,它采用三平面哈希表示来维护主体身份。可以生成同步的嘴唇运动、面部表情和稳定的头部姿势,并恢复头发细节以创建高分辨率视频。
Pyramid-Flow是一种由北京大学、快手科技和北京邮电大学联合开发的开源AI视频生成模型。该模型能够根据文本提示生成长达10秒、分辨率高达1280x768、帧率24帧每秒的高清视频。
Allegro模型是由人工智能公司Rhymes AI开发的一种先进的文本到视频生成模型。该模型的主要功能是将简单的文字描述转换为高质量的短视频片段,支持各种电影主题,包括人物特写和动作场景。
T2V-Turbo是一种文本到视频生成模型
视频生成模型Loong是一种基于自回归大语言模型(LLM)的新型视频生成器,由中国香港大学和字节跳动的研究人员共同推出。该模型能够生成长达一分钟的连贯、内容丰富的视频。
GameGen-O是腾讯推出的一款专门用于生成开放世界视频游戏的AI模型。它基于Transformer架构,能够模拟多种游戏引擎的功能,包括生成游戏角色、动态环境、复杂动作和事件等。
白日梦是一款人工智能短视频创作工具。它利用人工智能技术,可以自动生成剧情类视频的脚本和分镜,并从海量素材库中挑选合适的素材进行剪辑,帮助用户快速创作出高质量的短视频。
Flow Studio是一个强大的视频生成工具,能够一键生成具有电影质量的3分钟视频。这些视频不仅包含引人入胜的剧情和一致的角色设定,还配备了完美匹配的背景音乐和音效。
什么是HotshotAIHotshotAI是一款由AakashSastry、JohnMullan和D[…]
FancyVideo是360AI研究中心和中山大学的研究人员推出新型视频生成模型,它能够根据文本提示生成动态丰富且时间上连贯的视频。
MovieDreamer是由浙江大学与阿里巴巴集团联合研发的新型视频生成框架。它巧妙地结合了自回归模型的复杂逻辑处理能力和扩散模型的视觉渲染技术,旨在生成具有丰富情节和高视觉保真度的长时视频内容。
CogVideo是一个革命性的文本到视频生成模型,其主要功能是将输入的文本描述转换为相应的视频内容。
MOKI是由美图公司推出的一款专注于视频创作者的AI工具,旨在简化视频制作流程并提高创作效率。MOKI基于美图自研的奇想智能大模型(MiracleVision),通过AI技术为用户提供从前期策划到后期制作的全方位解决方案。
Autoshorts.AI 是一款AI短剧视频创作工具,旨在简化短视频制作流程,用户只需选择剧本风格,剩下的工作由工具自动完成。该工具能够一键覆盖脚本撰写、视频生成、后期剪辑、画面配音与配乐全流程
SkyReels是由昆仑万维推出的一款融合3D引擎与生成式AI的视频创作平台,集成了剧本生成、角色定制、分镜设计、剧情、对白/BGM及影片合成等功能,让创作者能轻松制作高质量AI视频。
MIMO AI 是阿里巴巴集团智能计算研究所推出的一种新型可控角色视频合成框架。它基于空间分解建模技术,将2D视频转换为3D空间代码,实现对角色、动作和场景的精确控制。
StableIdentity是一个创新的图像与视频定制化生成工具。并提供了一种独特的方法,可以将任何人无缝地插入到任意场景中,无论是现实世界还是艺术作品,旨在通过优化学习身份,结合包含动作、背景、风格的文本提示,实现图像定制生成。
NarratoAI 是一款强大的自动化影视解说和编辑工具。它集成了先进的人工智能大模型,专注于为视频制作提供一站式解决方案。无论是专业的视频创作者,还是刚刚踏入视频创作领域的新手,都能通过 NarratoAI 轻松地完成高质量的视频内容创作。
Video-Subtitle-Remover(VSR)是一款基于人工智能技术开发的视频处理软件,专门用于去除视频中的硬字幕和文本水印。
Clapper是一款由个人开发者独立制作的开源AI视频剪辑工具,旨在通过集成多种先进的人工智能技术来简化视频创作流程。它不仅支持图像、语音和音乐生成,还提供了一键生成素材的功能,使用户能够快速创建所需的视频内容。
FateZero是一种基于文本的零镜头视频编辑方法,旨在无需按提示训练或使用特定用途的掩码即可实现对现实世界视频的编辑。
SAM 2(Segment Anything Model 2)是Meta公司开发的用于图像和视频中分割对象的统一模型,旨在实现图像和视频中对象的实时、可提示分割。
Stable Video 4D(SV4D)是Stability AI推出的一款创新性4D视频生成模型,基于Stable Video Diffusion(SVD)和Stable Video 3D(SV3D)开发。该模型的主要功能是将单一视角的视频转换为多个新视角的视频,从而生成一个四维图像矩阵。
ProPainter是一款基于E2FGVI技术的AI视频编辑工具,适用于各种视频修复和编辑需求,如移除对象、去除水印、高清修复等。
Tailor是一款功能强大的视频智能裁剪、视频生成和视频优化工具。该软件使用了先进的人工智能技术,能够通过简单的操作实现复杂的视频处理任务,从而节省时间和精力。
NaRCan是一个基于深度学习的视频编辑框架,通过整合扩散先验和LoRA微调技术,成功生成了高质量的自然规范图像,极大提升了视频编辑的效率与质量。
Diffutoon是由阿里巴巴和华东师范大学的研究人员共同推出的一种基于扩散模型的高分辨率可编辑卡通着色技术,旨在将真实感视频转换为动漫风格。
MoneyPrinterTurbo是一个创新的开源项目,由开发者 harry0703 发起,利用人工智能大型语言模型(AI LLM),简化高清短视频的生成过程。用户只需一键操作,即可快速制作出引人注目的视频内容。
VisualClipPicker是一个创新的视觉剪辑选择器,它通过先进的人脸识别技术,能够自动识别视频中的人脸,并根据这些信息来修剪剪辑。
必剪Studio是B站推出的一款免费AI数字分身定制和视频创作工具。
FunClip是一款完全开源、本地部署的自动视频编辑工具。
Follow-Your-Canvas 是一种由腾讯混元团队开发的视频扩展技术,旨在将现有视频内容扩展到更高的分辨率,并在扩展区域生成丰富的新内容。
PGTFormer 是一种新颖的视频人脸修复方法,由西安电子科技大学和西南科技大学联合提出,通过解析引导的时间一致性变换器,无需预对齐操作,有效解决了传统方法中的时间不一致性和伪影问题,显著提高了人脸恢复的效率和准确性
DiffIR2VR-Zero技术概述DiffIR2VR-Zero是一种视频恢复方法。它基于预训练的扩散模型,[…]
什么是FlashDiffusionFlashDiffusion是一种基于扩散模型的图像生成技术,它通过[…]
Veo是由Google DeepMind开发的一款先进的视频生成模型,能够根据文本、图像或视频提示生成高质量的1080P分辨率视频。
APISR 是一款开源的基于现实世界动漫画面的超分辨率恢复与增强工具。该工具专门设计用于改善低质量、低分辨率的动漫图像和视频。
什么是VivaViva是由智象未来推出的一款免费在线AI创意视觉设计平台。提供AI图像生成、图像重绘与扩展、[…]
VideoGigaGAN是由Adobe和马里兰大学的研究人员提出的一种新型的生成式视频超分辨率(VSR)模型
Adobe Premiere Pro加入了生成式AI功能,这些功能由Firefly的新视频模型提供支持,并能使用Open AI、Runway和Pika的第三方AI大模型。编辑人员可通过AI功能轻松添加、移除对象,扩展素材,并享受更多创作灵活性,极大简化了视频编辑工作流程,提高了编辑效率。
GoEnhance AI是一个AI驱动的图像和视频编辑工具,主要功能包括视频风格转换、图像增强和放大。它利用人工智能技术来增强和放大图像和视频的细节和分辨率。
Google Vids是谷歌为其Google Workspace协作办公平台推出的一款AI驱动的视频创作工具。
Topaz Video AI 是一款基于人工智能技术的视频编辑软件,它能够自动化地提高视频的画质,并且可以将低分辨率的视频转换为高分辨率的视频。
FreeU是一个旨在提升Diffusion U-Net模型图像生成质量的工具或方法。它主要通过增强U-Net的去噪能力来实现这一目标,而不需要额外的训练或微调。
Wink App和WinkStudio是美图公司推出的视频剪辑和修图工具。Wink App是一款手机端的高清画质修复神器,能够修复照片和视频的画质,打造自然服帖精致的人像效果。WinkStudio是桌面端的AI视频编辑工具,提供全新的创作体验,服务于视频内容创作者。
适用于视频合成、图像到视频、视频修补、风格化生成等内容创作和视频编辑应用
修复去噪增强视频工具
CoTracker3是一种由Meta AI推出的新一代视频点追踪模型,旨在提高视频中像素级目标的追踪效果。
Noisee AI是由知名科技公司月之暗面Moonshot AI旗下Tranquillitatis Inc开发,旨在将音乐旋律转化为视觉艺术作品。Noisee AI的核心功能是将用户提供的音频转换为具有相应节奏和风格的视频。用户可以上传音频或提供音频链接,AI将基于音乐的节奏和风格,生成30秒至60秒的视频内容。