在一場備受矚目的人工智能國際象棋錦標賽中,OpenAI的o3模型展現出壓倒性優勢,以全勝戰績奪得冠軍。這場比賽有一個特殊規則:參賽的AI模型必須在沒有接受任何專門象棋訓練的前提下參賽,只能在賽前從互聯網獲取基礎的國際象棋知識。

決賽階段,o3面對來自xAI的Grok4,最終以4-0的懸殊比分輕鬆獲勝。更令人印象深刻的是,o3在整個錦標賽期間保持了完美記錄,三場比賽均以4-0的比分獲勝,甚至在半決賽中橫掃了同爲OpenAI開發的o4mini模型。

Grok4在進入決賽的道路上同樣表現不俗,連續擊敗了Google的兩個強勁對手——Gemini2.5Flash和Gemini2.5Pro。當時,埃隆·馬斯克還頗爲自信地表示,xAI團隊"基本沒在象棋上花功夫",暗示Grok4的天然實力。

image.png

然而,決賽的結果讓許多觀察者大跌眼鏡。國際象棋對弈網站Chess.com的總編輯Pedro Pinhata在賽後報道中寫道:"直到半決賽,似乎沒有什麼能夠阻止Grok4贏得比賽。但這種幻覺在比賽的最後一天破滅了。"

擔任解說嘉賓的國際象棋大師中村光在直播中直言不諱地指出:"Grok在比賽中犯了很多錯誤,但OpenAI沒有。"這個簡潔的評價道出了勝負的關鍵。

更有趣的是世界排名第一的國際象棋大師芒努斯·卡爾森的點評。他表示,決賽中兩個AI模型的棋力水平大約相當於剛學會規則的普通棋手,ELO等級分約爲800分。作爲對比,卡爾森本人的ELO達到2839分,排名第二的中村光也有2807分,兩者之間的差距可謂天壤之別。

image.png

卡爾森進一步分析了這些通用AI模型在象棋方面的侷限性。他發現,這些模型的表現極不穩定,棋藝時好時壞。它們在計算吃棋子方面表現尚可,但在真正將死對手這一核心目標上卻顯得力不從心。"它們懂得物質優勢,卻不懂如何取勝,"卡爾森形象地比喻道,"這就好比擅長收集食材,卻不會做飯一樣。"

這場比賽的結果與專門設計的象棋AI形成了鮮明對比。回顧歷史,1997年擊敗國際象棋大師加里·卡斯帕羅夫的超級電腦"深藍",以及2016年戰勝韓國圍棋九段李世石的AlphaGo,都是專門爲棋類遊戲量身打造的程序,擁有深度的領域知識和專業訓練。

image.png

事實上,通用AI模型在專業棋類領域的侷限性早有先例。今年早些時候,在國際象棋大師Levy Rozman組織的另一場錦標賽中,Grok和ChatGPT都敗給了專爲國際象棋設計的人工智能系統Stockfish,進一步證實了通用模型與專業系統之間的實力差距。

這場AI象棋錦標賽不僅展示了當前通用人工智能模型的能力邊界,也爲我們理解AI在特定領域的表現提供了有價值的參考。儘管這些模型在語言理解和生成方面表現出色,但在需要深度戰略思維和專業知識的領域,它們仍有很長的路要走。