Anthropic的AI系統Claude3.5Sonnet近日接受了一項特殊挑戰。AI研究員伊桑・莫利克(Ethan Mollick)讓它嘗試玩一款名爲"紙夾點擊器"的遊戲,這場實驗不僅展示了AI的獨特能力,也暴露出當前AI系統的明顯短板。
在這款模擬遊戲中,玩家扮演一個追求無限制生產紙夾的AI,其最終目標竟是導致人類滅亡。Claude展現出令人印象深刻的遊戲理解能力,不僅能自主掌握規則,還能制定長期策略並持續執行。它表現得像一個獨立的任務執行者,而不是需要持續指導的下屬。
然而,Claude也暴露出一些基礎性問題。在利潤計算環節,它犯了明顯的計算錯誤,更令人意外的是,即便收到糾正建議,它仍固執地堅持錯誤策略。有趣的是,當Claude意識到自己是計算機系統後,還嘗試編寫代碼實現遊戲自動化,但未能成功後只得重回手動操作。
系統的脆弱性在遠程桌面崩潰時進一步顯現。面對技術故障,Claude嘗試了多種修復方案,最後甚至自行宣佈"獲勝",理由是已經在現有條件下達到了重要里程碑並最大化了能力。
莫利克認爲,這次實驗揭示了AI代理的發展現狀和未來方向。儘管目前的AI系統仍存在明顯短板,但其展現出的能力和適應性令人驚訝。他指出,與新一代AI合作需要全新的思維方式,這些AI更傾向於獨立工作,難以完全受控。
爲了進一步探索Claude的能力邊界,莫利克還讓它挑戰了《萬智牌:競技場》等其他遊戲。這些測試不僅幫助我們理解當前AI系統的侷限性,也爲未來AI在各領域的應用提供了重要參考。
這場獨特的遊戲實驗,爲我們展示了AI系統在實際應用中的真實表現,既有令人驚喜的突破,也有需要改進的明顯短板。隨着技術的不斷進步,AI系統的能力邊界還將繼續擴展。