一項令人矚目的AI突破近日引發了遊戲界和科技圈的廣泛關注。研究團隊成功開發出一款名爲DIAMOND(Diffusion for World Modelling)的AI模型,能夠在神經網絡中模擬運行《反恐精英:全球攻勢》(CS:GO)的簡化版本。這一創新成果不僅展示了AI在遊戲模擬領域的巨大潛力,更爲未來虛擬世界的構建提供了全新思路。

DIAMOND模型的一大亮點在於其驚人的效率。在單塊Nvidia RTX3090顯卡的支持下,模型就能以每秒10幀的速度運行CS:GO模擬。更令人驚歎的是,研究團隊僅用87小時的CS:GO遊戲數據就完成了模型訓練,這僅相當於類似項目GameNGen所用數據量的0.5%。如此有限的數據卻能產生如此令人印象深刻的遊戲模擬,充分展現了DIAMOND模型的強大性能。

image.png

DIAMOND的核心技術基於Transformer架構,它將玩家的移動視爲"詞元"(token),類似於句子中的單詞。通過預測這些詞元,模型學會了根據先前的動作來預判下一步移動。這種創新方法最初應用於雅達利遊戲,現在成功遷移到了更復雜的CS:GO環境中。

研究者Eloi Alonso在社交媒體上展示了模型的能力。視頻中,玩家們使用鍵盤和鼠標與模擬的CS:GO環境進行互動。模擬不僅包含了玩家交互、武器機制等基本元素,還涵蓋了複雜的環境物理效果,展現出令人驚歎的真實感。

然而,DIAMOND模型仍存在一些明顯的侷限性和缺陷。例如,由於模型未能完全理解Source引擎的重力和碰撞檢測機制,玩家可以無限跳躍。此外,一旦玩家偏離訓練數據中常見的路徑,整個模擬就會崩潰。這些問題凸顯了AI模擬複雜遊戲世界時面臨的挑戰。

研究團隊對DIAMOND的未來發展持樂觀態度。他們認爲,通過增加數據量和計算能力,模型的表現將會進一步提升。更遠大的目標是,他們希望這項技術能爲開發能夠在複雜現實環境中導航的AI模型鋪平道路。

值得一提的是,DIAMOND的靈感來源於Google Research、Google DeepMind和特拉維夫大學共同開發的GameNGen系統。GameNGen能夠在單個Google TPU芯片上以每秒超過20幀的速度完整模擬經典遊戲DOOM的部分內容。

對於希望深入探索這項技術的開發者和研究者來說,DIAMOND模型的源代碼已在GitHub上公開。這無疑將推動更多創新應用的誕生,加速AI遊戲模擬技術的發展。

儘管DIAMOND在模擬CS:GO方面取得了突破性進展,但它也揭示了AI在複製複雜交互系統時面臨的挑戰。隨着技術的不斷進步,我們可以期待看到更加逼真、流暢的AI遊戲模擬。這不僅將爲遊戲開發帶來革命性變化,還可能爲虛擬現實、訓練模擬器等領域提供寶貴的技術支持。