Genmo公司最近开源了一款名为Mochi1的视频生成模型,这一举措在AI视频生成领域引起了广泛关注。Mochi1以其卓越的运动质量、高画质和流畅性而著称,能够生成连贯、逼真的视频内容,甚至家用电脑也能利用它创作出好莱坞级别的大片。
Mochi1采用了创新的Asymmetric Diffusion Transformer(AsymmDiT)架构,并拥有高达100亿个参数,是目前公开发布的最大视频生成模型之一。该模型完全从头开始训练,具有简单、可修改的特点,为开发者提供了极大的便利。此外,Mochi1在内部测试中表现出色,击败了许多其他视频AI模型,包括专有的竞争对手Runway和Luna。
Mochi1不仅能够生成每秒30帧、持续5.4秒的视频,还具备高时间连贯性和逼真的运动动态,能够模拟物理学如流体动力学和毛发模拟。它擅长遵循详细的用户说明,允许对生成视频中的字符、设置和操作进行精确控制。
Mochi1的开源发布不仅为视频生成领域树立了新的标杆,也为广大开发者和创作者提供了强大的工具,使他们能够更轻松地实现高质量的视频创作
声明:文章来源于网络,如有侵权请联系删除!