注目を集めた人工知能のチェス選手権で、OpenAIのo3モデルは圧倒的な優勢を示し、全勝の成績で優勝しました。この大会には特別なルールがありました。参加するAIモデルは、チェスに関する専門的なトレーニングを受けずに参加しなければならず、大会前にインターネットから基本的なチェスの知識のみを取得できたのです。

決勝では、o3はxAIのGrok4と対戦し、4-0のスコアで楽に勝利しました。さらに印象的だったのは、o3が大会全体で完璧な記録を維持したことで、3試合とも4-0で勝利し、準決勝では同社が開発したo4miniモデルを完全に打ち負かしました。

Grok4は決勝進出の道でも非常に強かったようで、Googleの2つの強敵であるGemini2.5FlashとGemini2.5Proを連続して破りました。当時、イーロン・マスクは自信を持って、「xAIチームはチェスに対してほとんど取り組んでいない」と述べ、Grok4の自然な力強さを示唆していました。

image.png

しかし、決勝の結果は多くの観客にとって予想外でした。チェス対局サイトChess.comの編集長Pedro Pinhataは、試合後に行われた報道で、「準決勝まではGrok4が勝つことには何ら問題なかったように思えたが、最終日になってその幻想は崩れました」と述べました。

解説者として登場したチェスのグランドマスター中村光は、放送中に率直に語った。「Grokは試合中に多くのミスを犯したが、OpenAIはそれを見せなかった。」という簡潔な評価が、勝敗の鍵を表していました。

さらに興味深いのは、世界ランキング1位のチェスグランドマスター、マグナス・カールセンのコメントです。彼は、決勝での2つのAIモデルの実力が、ルールを学んだばかりの一般的なチェスプレイヤーとほぼ同等であり、ELOランクは約800点であると述べました。比較すると、カールセン自身のELOは2839点で、第2位の中村光も2807点であり、両者の差は天と地の差です。

image.png

カールセンは、これらの汎用型AIモデルがチェスにおいて持つ限界についてさらに分析しました。彼は、これらのモデルのパフォーマンスが極めて不安定であり、将棋の腕前が良いときもあれば悪いときもあることを発見しました。駒を取る計算についてはある程度できますが、相手を詰めるという核心的な目標に関しては苦手です。「彼らは物質的な優位性は理解しているが、勝つ方法は知らない」とカールセンは象徴的に表現しました。「これは、食材を収集することは得意だが、料理を作ることはできないようなものです。」

この試合の結果は、専門的に設計されたチェスAIとは明確な対照をなしています。歴史的に見ると、1997年にチェスのグランドマスターであるガリー・カスパロフを破ったスーパーコンピュータ「ブルーステイン」や、2016年に韓国のプロ棋士李世石を破ったAlphaGoなど、すべてがチェスや将棋などのゲームに特化して作られたプログラムであり、深い分野知識と専門的なトレーニングを持っていたことがわかります。

image.png

実際、汎用型AIモデルが専門的なチェス分野で持つ限界は以前から例があります。今年の早い時期に、チェスグランドマスターLevy Rozmanによって主催された別のトーナメントで、GrokとChatGPTはチェス専用のAIシステムであるStockfishに敗れており、汎用モデルと専門システムの実力差を再確認させました。