正文

Google DeepMind發佈Genie 2，一鍵生成無限虛擬世界

發布於AI新閒資訊

時間 :Dec 5, 2024

閱讀 :1分鐘

Google DeepMind近期發佈的Genie2，正以其驚人的世界生成能力，重新定義了AI訓練和交互的可能性。

Genie2是一個革命性的基礎世界模型，能夠通過自然語言指令，實時生成高度多樣化且邏輯連貫的虛擬世界。這一模型最大的亮點在於:它不僅可以創建複雜的3D環境，還能讓用戶或AI智能體與之進行長達一分鐘的交互。

這個"虛擬世界生成器"的應用場景極其廣泛。無論是迷宮、自然場景，還是模擬人類社會環境，Genie2都能精準地生成。對於AI訓練來說，這意味着可以構建無限多樣且富有挑戰性的學習場景，特別是在機器人和虛擬助手等領域，將產生革命性影響。

Genie2展現出的能力令人矚目:它可以智能識別操作控件、生成反事實場景、記憶不可見世界、動態創建內容，並模擬複雜的物理現象。從水效果、煙霧、重力到光照反射，Genie2幾乎涵蓋了現實世界的所有關鍵物理特徵。

更令人興奮的是，這個模型可以從單個圖像提示開始，通過鍵盤和鼠標輸入，快速構建一個完整的交互世界。研究人員甚至可以使用真實世界的照片作爲起點，生成栩栩如生的虛擬場景。

儘管Genie2目前還處於早期研究階段，但Google DeepMind的研究團隊相信，這項技術將爲訓練更加通用的人工智能系統鋪平道路。它不僅能幫助開發更智能的AI代理，還爲未來的創意工作流程提供了全新的可能性。

這項突破不僅是技術的勝利，更是人工智能向更加開放、更具創造力方向發展的重要里程碑。我們正在見證一個全新的AI世界生成時代的開啓。

詳情：https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/

Apache 2.0 協議加持！谷歌 Gemma 4 正式開源：31B 參數性能直逼頭部大模型

谷歌DeepMind發佈新一代開源模型Gemma4，性能實現代際跨越，並將許可證改爲Apache2.0，方便開發者商用和二次開發。此次推出四款不同規格模型，覆蓋從手機端到工作站的全場景需求。

周深新歌《月之紀》發佈時明確標註“禁止用於AI訓練”，成爲國內首例在發佈時即劃定AI版權紅線的案例，標誌着音樂人進入“數字化防禦”階段，保護聲音權與創作主權。

Google DeepMind 新推出的 Lyria 3 Pro 模型將音樂生成時長從 30 秒大幅提升至 3 分鐘，並新增“結構感知”能力，使模型能理解並生成包含前奏、主歌、副歌等完整結構的歌曲，突破了此前僅能生成背景音效的限制。

在2026年GDC大會上，Google DeepMind展示了生成式AI模型Genie3，旨在自動化生成互動內容。團隊冷靜指出，當前AI生成的遊戲世界連貫性嚴重不足，運行數分鐘後即出現大規模邏輯錯誤與畫面崩潰。現場觀察顯示，其遊戲體驗僅在前60秒保持流暢，隨後環境一致性迅速瓦解。

美國AI行業出現罕見跨公司聯合行動，OpenAI和Google DeepMind等30多名員工支持Anthropic起訴美國國防部，抗議其被列爲供應鏈風險名單，認爲此舉武斷且威脅行業發展。

智啟未來，您的人工智能解決方案智庫