最近、人工知能分野の二大巨頭であるOpenAIとグーグルDeepMindはそれぞれ、2025年の国際数学オリンピック(IMO)でAIモデルが金メダルを獲得したことを発表しました。この成果は、人工知能システムの驚異的な進化速度を示すだけでなく、両社間で「リーダーシップ」に関する認識の激しい競争を引き起こしました。
IMOは世界で最も歴史があり、最も挑戦的な高校生向けの数学コンペティションの一つであり、その結果は人工知能の推論能力を測る重要な基準とされています。昨年、グーグルは人間の協力を必要とする「公式」システムによってIMOで銀メダルを獲得しました。今年、OpenAIとグーグルはともにさらに進化した**「非公式」システム**を発表しました。これらのシステムは自然言語の問題から情報を直接抽出し、人間による変換なしに論理的かつ裏付けのある答えを生成できます。両社とも自身のAIモデルがIMO試験で6問中5問を正解し、多くの高校生や昨年のグーグルのAIモデルよりも優れた結果を達成したと主張しています。
推論モデルの突破と議論
取材に対して、OpenAIとグーグルのIMOプロジェクトの研究者は、これらの金メダルの結果がAI推論モデルが検証不可能な領域での突破を示していると述べました。これは特に重要です。なぜなら従来のAI推論モデルは答えが明確な問題(例えば簡単な数学やプログラミング)には長けていますが、解決策が曖昧なタスク(例えば複雑な研究の支援など)では性能が劣るからです。
しかし、今回の金メダルの結果についての**「誰が最初に発表したか」「どのように発表したか」**に関する点で、両社は激しい論争を巻き起こしました。OpenAIは土曜日の朝に自社のAIモデルが金メダルを獲得したことを最初に発表しました。この行動はすぐにグーグルDeepMindのCEOや研究者から批判を受けました。グーグルDeepMindの上級研究員でIMOプロジェクトの責任者であるThang Luong氏はTechCrunchに対して、グーグルは参加生徒への敬意を込めて公式結果の公開を待つことにしたと語りました。また、国際数学オリンピックの運営機関と協力して試験を準備し、月曜日の朝に公式結果を発表しました。この結果はIMOの会長と公式採点の支持を得ています。Luong氏は、「国際数学オリンピックの運営機関には独自の採点基準があります。したがって、それらの基準に基づかない評価は金メダルのレベルに達したとは言えません」と強調しました。
意見が対立し、競争が白熱化
OpenAIがIMOモデルを開発したNoam Brown氏は、IMOが数か月前からOpenAIを正式なコンペティションに招待していたが、当時は自然言語システムの開発に注力していたため断ったと説明しました。Brown氏は、OpenAIはIMOがグーグルと非公式テストを行っていることについては知らなかったと述べました。OpenAI側は、自身のAIモデルのパフォーマンスを評価するために、3人の採点システムに精通した元IMO受賞者を第三者評価者として雇ったと説明しました。金メダルの結果を知った後、OpenAIはIMOに連絡を取りましたが、IMOは金曜日の授賞式終了後に結果を発表するよう勧めました。IMO側はTechCrunchのコメント依頼に対してまだ応答していません。
グーグルが手続き的にはより厳格だったとしても、この論争の背景には、世界のトップAIラボのモデルが急速に進歩している壮大なシナリオがあります。今年、世界のトップ高校生がIMOに集まりましたが、得点がOpenAIやグーグルのAIモデルに匹敵する人はごくわずかでした。これは、以前は遥かにリードしていたOpenAIが、これまで以上に激しい競争に直面していることを示しています。OpenAIが今後数か月以内にGPT-5を発表すると予定されていることから、AI分野におけるリーダー地位を維持することは、現在の「空気」戦いにおいて鍵となるポイントとなっています。