Google DeepMind 近日向部分用户开放了全新的 AI 模型 Project Genie。这款工具突破了传统内容生成的边界,让用户仅通过简单的文本描述或上传一张静态图片,就能即时构建出可交互的虚拟世界,并像玩电子游戏一样在其中自由探索。
Project Genie 的背后是多种顶尖 AI 技术的融合。它以 Genie3 模型为基础,结合了 Nano Banana Pro 图像生成模型以及 Gemini 多模态模型。通过这一组合,系统能够将自然语言提示词转化为沉浸式互动场景,无论是驾驶飞船掠过异星行星,还是在亚马逊雨林中奔跑,都能快速成型。

实时交互:不仅是画面,更是“活”的世界
与单纯的视频生成不同,Project Genie 具备实时响应能力:
实时生成:系统会根据玩家的操作(如移动角色、转动视角)实时渲染画面帧。
深度互动:支持与场景内物体的交互,例如演示中蓝色小球滚动时会实时改变草地的颜色轨迹。
个性化定制:用户可以上传自己绘制的角色或现实照片作为素材,并自行设定交互逻辑。
目前,Project Genie 仍处于早期实验阶段。受限于算力等因素,每次生成的体验时长被限制在60秒以内,且偶尔会出现技术 Bug。但 DeepMind 团队表示,未来将重点研究如何突破时长限制,并赋予用户更多对环境的控制权。
该技术的应用前景广阔,有望彻底改变游戏开发的流程,帮助电影人快速可视化分镜,甚至在教育领域通过模拟灾后救援等复杂场景来辅助教学。目前,拥有美国地区 Google AI Ultra 账户且年满18岁的用户已可率先体验这一前沿工具。
