MagicPose是南加州大学&字节提出的一种新颖有效的方法,提供逼真的人类视频生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MotionLCM是清华大学和上海人工智能实验室的研究人员提出的一种基于潜在一致性模型的实时可控运动生成技术。
DiffSynth Studio是一款创新的扩散引擎,专为图像和视频合成爱好者设计。用户可以进行AI绘图、长视频合成、图像合成、卡通着色和视频风格化等多种操作。
Vitron由昆仑万维2050全球研究院、新加坡国立大学和新加坡南洋理工大学团队联合发布并开源的通用像素级视觉多模态大语言模型。
什么是FlashDiffusionFlashDiffusion是一种基于扩散模型的图像生成技术,它通过[…]
Veo是由Google DeepMind开发的一款先进的视频生成模型,能够根据文本、图像或视频提示生成高质量的1080P分辨率视频。
Dream Machine是由Luma AI开发的一款AI视频生成工具,旨在通过文本和图像快速生成高质量、逼真的视频内容。
VideoTetris是由北京大学与快手AI团队共同推出的视频生成框架,用以实现复杂视频的生成。VideoTetris技术的核心在于其创新的时空组合扩散模型。这一模型能够精确捕捉文本中描述的复杂场景和动态变化,通过操纵去噪网络的注意力图,实现视频内容的精确生成。无论是静态场景的细腻描绘,还是动态过程的流畅展现,VideoTetris都能够游刃有余。
ShareGPT4Video是一个旨在通过提供密集且精确的视频标题来改善大型视频语言模型(LVLMs)对视频的理解和文本到视频模型(T2VMs)的视频生成的项目。
星火绘镜是科大讯飞推出的AI短视频创作平台,能够将输入的文本描述自动转换成视频内容(如短剧、预告片、MV),包括生成视频剧本、分镜,最终形成完整的短视频。
海螺AI一个基于人工智能技术的虚拟助手,由上海稀宇科技有限公司(MiniMax)开发。旨在通过自然语言处理和机器学习技术,为用户提供各种信息查询、任务执行、知识解答等服务。
什么是Tune-A-VideoTune-A-Video是一种视频生成新技术,它通过一次性调整将预训练的图像扩[…]
可灵是快手推出了一款AI视频生成大模型。可灵大模型是快手AI团队自主研发的成果,它采用了先进的3D时空联合注意力机制,能够生成符合物理规律的大幅度运动视频。
FIFO-Diffusion是一种基于预训练扩散模型的文本条件视频生成技术。这项技术的核心在于它能够无需额外训练,直接从文本描述生成无限长度的视频。
什么是VivaViva是由智象未来推出的一款免费在线AI创意视觉设计平台。提供AI图像生成、图像重绘与扩展、[…]
MoneyPrinterTurbo是一个创新的开源项目,由开发者 harry0703 发起,利用人工智能大型语言模型(AI LLM),简化高清短视频的生成过程。用户只需一键操作,即可快速制作出引人注目的视频内容。
PhysDreamer是一种基于物理的方法,它能够为静态的3D物体注入交互式动态效果。利用AI视频生成模型学习到的运动先验知识,预测物体在不同交互作用下的运动状态。它能够为静态的3D物体注入逼真的交互式动态效果,
Stable Artisan是一个基于Discord平台的AI媒体生成和编辑工具,它的核心魅力在于其集成了Stability AI的多个先进模型
StoryDiffusion是一款由南开大学HVision团队开发的人工智能工具,主要功能是生成连贯的图像和视频故事。
Adobe Premiere Pro加入了生成式AI功能,这些功能由Firefly的新视频模型提供支持,并能使用Open AI、Runway和Pika的第三方AI大模型。编辑人员可通过AI功能轻松添加、移除对象,扩展素材,并享受更多创作灵活性,极大简化了视频编辑工作流程,提高了编辑效率。
StreamingT2V是PicsArt推出的一款AI视频生成模型,能够根据文本描述生成长达2分钟的视频
Google Vids是谷歌为其Google Workspace协作办公平台推出的一款AI驱动的视频创作工具。
MagicTime是一款基于文本描述生成高质量延时视频的AI模型,它通过学习时间流逝视频中的物理知识,实现了高度逼真的变化过程模拟,为用户提供了一种快速、高效且易于操作的延时视频制作解决方案。
MuseV是一款由腾讯音乐天琴实验室开发的AI视频生成系统,它基于扩散模型(Diffusion),采用视觉条件并行去噪方案,能够生成任意长度的高保真虚拟人物视频。
MiracleVision(奇想智能)是美图公司自研的一款AI视觉大模型,旨在通过人工智能技术提升图像和视频的创作与处理能力。
MicroCinema是一个简单而有效的文生视频框架,实现了高质量且连贯的文本到视频的生成。
Mora是微软推出的一款视频生成和编辑软件,支持文字转视频,图片转视频以及扩展已生成的视频,专注于提供短时视频内容创作的能力
Etna是一款功能强大的AI视频生成工具,它不仅能够根据文本描述自动生成高质量的视频内容,而且还能提供流畅自然的视觉效果,极大地提升了内容创作和表达的方式。
Dreamina是字节跳动旗下剪映平台推出的一款AI创作工具,主要功能包括文字绘图、扩图、局部重绘和图片灵感生成以及视频生成等。
AtomoVideo是一个由阿里巴巴开发的高保真图像到视频生成框架,其核心技术是多粒度图像注入技术,这使得生成的视频对给定的图像具有更高的保真度。