近日,Verses 團隊研發的 Genius 智能體在經典遊戲 Pong 中創造了驚人佳績,僅用10% 的數據和2小時的訓練時間,便超越了頂尖人類玩家和其他 AI 模型。這一突破性進展標誌着 AI 技術的全新里程碑,預示着未來智能體的發展方向。

Genius 智能體的成功離不開其獨特的設計理念。與傳統的大型模型相比,Genius 的規模僅爲 SOTA 模型 IRIS 的4%,並且能夠在普通的 M1芯片的 MacBook 上運行。研究人員的靈感來源於四年前的實驗,科學家們發現培養的 “盤中大腦” 能在短短5分鐘內學會 Pong 遊戲,這引發了他們對模仿人腦工作方式的思考。

機器人 人工智能 AI

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

Verses 團隊認爲,傳統的基於大模型的 AI 智能體在邏輯推理方面存在嚴重不足。現有的模型更多地依賴於記憶訓練數據中的推理步驟,缺乏真正的主動性和好奇心。Genius 智能體採用了認知引擎的概念,不僅具備認知、推理和決策能力,還賦予了智能體主動學習的能力。

在與 IRIS 和其他 AI 模型的對比測試中,Genius 展現出強大的學習能力。研究者在2小時內用1萬步的遊戲數據對 Genius 進行了訓練,結果顯示其表現超過了訓練兩天的 IRIS。Genius 的成功不僅在於快速學習能力,更在於其在遊戲中的主動表現。例如,在 Pong 比賽中,Genius 在落後情況下仍能逆轉獲勝,這一現象在 IRIS 的訓練中未曾出現。

不過,研究者們也提醒,儘管 Genius 的表現令人振奮,但目前尚缺乏能夠全面衡量 AGI 表現的統一標準,需要進行多樣化測試來驗證其在不同領域的適應性與可靠性。

這一研究成果不僅推動了 AI 智能體的發展,也爲未來的機器智能探索提供了新的思路和方法。

論文地址:https://arxiv.org/pdf/2410.05229