Google DeepMind 近日向部分用戶開放了全新的 AI 模型 Project Genie。這款工具突破了傳統內容生成的邊界,讓用戶僅通過簡單的文本描述或上傳一張靜態圖片,就能即時構建出可交互的虛擬世界,並像玩電子遊戲一樣在其中自由探索。

Project Genie 的背後是多種頂尖 AI 技術的融合。它以 Genie3 模型爲基礎,結合了 Nano Banana Pro 圖像生成模型以及 Gemini 多模態模型。通過這一組合,系統能夠將自然語言提示詞轉化爲沉浸式互動場景,無論是駕駛飛船掠過異星行星,還是在亞馬遜雨林中奔跑,都能快速成型。

image.png

實時交互:不僅是畫面,更是“活”的世界

與單純的視頻生成不同,Project Genie 具備實時響應能力:

  • 實時生成:系統會根據玩家的操作(如移動角色、轉動視角)實時渲染畫面幀。

  • 深度互動:支持與場景內物體的交互,例如演示中藍色小球滾動時會實時改變草地的顏色軌跡。

  • 個性化定製:用戶可以上傳自己繪製的角色或現實照片作爲素材,並自行設定交互邏輯。

目前,Project Genie 仍處於早期實驗階段。受限於算力等因素,每次生成的體驗時長被限制在60秒以內,且偶爾會出現技術 Bug。但 DeepMind 團隊表示,未來將重點研究如何突破時長限制,並賦予用戶更多對環境的控制權。

該技術的應用前景廣闊,有望徹底改變遊戲開發的流程,幫助電影人快速可視化分鏡,甚至在教育領域通過模擬災後救援等複雜場景來輔助教學。目前,擁有美國地區 Google AI Ultra 賬戶且年滿18歲的用戶已可率先體驗這一前沿工具。