李飞飞的创业项目World Labs:一张图生成交互式3D世界

李飞飞的创业项目World Labs发布了其首个AI产品,能够通过单张静态图片生成交互式3D世界。这一技术标志着空间智能领域的初步实现,旨在彻底改变电影、游戏和模拟器等领域的数字表现方式,提供更精细、沉浸式的体验。

该AI系统的核心优势在于它能够直接预测3D场景,而不是像大多数生成模型那样仅预测像素。生成的3D世界不仅遵循基本的3D几何物理规则,还具有持久现实性、实时控制性和正确的几何形状。用户可以通过键盘或鼠标自由探索和操作这个3D世界,甚至可以调节景深、推拉变焦、调整摄像机位置和视野、更改对象颜色等。

World Labs的系统属于新兴的人工智能范畴,即“世界模型”,能够模拟游戏和3D环境,并解决了现有模型存在的伪影和一致性问题。此外,World Labs还展示了如何将3D世界与其他AI工具结合,实现创意工作流,如使用文本到图像模型生成图像,并与MidjourneyRunway等工具结合设计摄像机路径。

目前,World Labs正在努力提高生成世界的大小和保真度,并探索新的用户交互方式。公司计划在2025年推出首款正式产品,目标用户包括艺术家、设计师、开发人员、工程师以及游戏和电影公司。

李飞飞表示,视觉空间智能是她的“北极星”,她认为AI的发展将超越平面图像或文本,迈向对三维世界的理解,这是智能发展的自然延伸

来源:www.aiug.cn
声明:文章来源于网络,如有侵权请联系删除!