谷歌升级AI视频生成模型 Veo2，4K分辨率、人类偏好评分优于Sora

AI资讯 4个月前硕雀

134 0 0

谷歌最近发布了其最新的AI视频生成模型Veo 2，这款模型在多个方面进行了显著升级，特别是在视频分辨率和人类偏好评分上表现优异。以下是关于Veo 2的详细介绍：

Veo 2能够生成最高4K（4096 x 2160像素）分辨率的视频，这一提升使得视频的细节和真实感得到了极大的增强。相比OpenAI的Sora模型，Veo 2的分辨率提升了四倍，而视频时长也增加了六倍，达到了数分钟。

Veo 2在物理引擎方面进行了优化，使其对现实世界的物理规律有了更深入的理解。这使得生成的视频在物理现象的模拟上更加逼真，例如光线、阴影和物体运动等。此外，Veo 2还加强了对人类动作和表情细微差别的捕捉能力，从而提高了视频的整体真实感。

Veo 2支持复杂的镜头控制指令，用户可以通过提示词指定镜头类型、画面风格或电影特效。例如，用户可以要求生成低角度跟踪镜头、特写镜头或广角镜头，Veo 2都能精准实现这些效果。这种高级的镜头控制能力使得Veo 2在创作高质量视频内容时具有更大的灵活性和表现力。

在人类评估者的测试中，Veo 2在“整体偏好”和“提示依从性”两项指标上均优于Sora及其他竞争对手。这意味着在实际应用中，观众更倾向于选择由Veo 2生成的视频。此外，Veo 2在生成过程中减少了不必要的细节错误（如多余的手指或意外物体），进一步提升了输出结果的真实度。

目前，Veo 2可以在谷歌实验室的VideoFX平台上试用，但普通用户需要通过谷歌表单注册并加入候补名单，等待谷歌在特定时间段开放访问权限。此外，Veo 2生成的视频将附带谷歌的元数据水印SynthID，以便识别其为AI生成内容。

尽管Veo 2在技术上取得了显著进步，但谷歌表示仍需继续开发和改进以克服创作者和观众的质疑。例如，创建逼真、动态或复杂的视频，并在复杂场景或复杂运动的场景中保持完全一致性仍然是一个挑战。

谷歌的Veo 2在视频生成领域展现了强大的竞争力，特别是在分辨率、真实感和人类偏好评分方面均优于OpenAI的Sora模型。随着技术的不断迭代和优化，Veo 2有望在未来进一步提升其在AI视频生成领域的地位。

Veo2

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！