Sora简介
Sora 是一个 OpenAI 开发的文本转视频AI模型,可以从文本指令中创建逼真和富有想象力的场景。与 GPT 模型类似,Sora 使用 transformer 架构,释放出卓越的扩展性能。
Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。该模型不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。该模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。Sora 还可以在单个生成的视频中创建多个镜头,以准确保留角色和视觉风格。
除了能够仅根据文本说明生成视频外,该模型还能够获取现有的静止图像并从中生成视频,从而准确无误地对图像内容进行动画处理,并注重小细节。该模型还可以拍摄现有视频并对其进行扩展或填充缺失的帧。在我们的技术报告中了解更多信息.
Sora是能够理解和模拟现实世界的模型的基础,我们相信这一能力将是实现AGI的重要里程碑。
OpenAI Sora官网:https://openai.com/sora