2025年の国際大学生プログラミングコンテスト(ICPC)世界最終戦で、OpenAIのシステムは優れたパフォーマンスを発揮し、試合中のすべての12のプログラミング問題を解決し、人間の選手やグーグルのDeepMindモデルを上回りました。OpenAIによると、このシステムが人間チームとして出場していたなら、間違いなく優勝するでしょう。

図の出典:AI生成の画像、画像のライセンス提供元Midjourney
OpenAIは、このシステムが試合中に学生と同じルールに従ったと説明しています。このシステムは標準的なPDF形式で問題セットを取得し、5時間の制限内で解決策を提出します。すべての提出は直接公式審査に送られ、人間の参加チームの解答と同時に評価されます。企業は、試合中にはこのシステムに対して特別な調整をしていないと強調しています。
このニュースが公開された後すぐに、グーグルのDeepMindは、そのアップグレード版であるGemini2.5Deep Thinkシステムが同じ試合で金メダルレベルに達したと主張しました。このシステムは12の問題のうち10個を解決し、人間のチームが解けなかったC問題も含んでいました。ただし、Geminiは他の2つの問題では成功できませんでした。それに対し、OpenAIのシステムは完璧な12/12の成績でDeepMindの結果を上回りました。
OpenAIは、このシステムが複数の一般的な推論モデルからなる統合体であり、ICPCに特化して訓練されていないと説明しています。このシステムはGPT-5と内部的な実験用推論モデルを使用しています。GPT-5は12の問題のうち11つに対して正しい答えを提供し、実験用モデルは最終的な回答を選択しました。最後で最も難しい問題は、実験モデルが単独で解決し、9回の提出の後にようやく受け入れられました。これと対比すると、最善の人類チームは11の問題しか解決できませんでした。
OpenAIは、この勝利がより複雑なモデルが深層推論および長時間計算能力において持つ潜在能力を証明していると強調しています。GPT-5が大部分の作業を担い、現在公的に利用可能な最も強力なAIモデルの一つであることを示しています。同社はこの成果を継続的な進歩の結果と考えています。これらのモデルは、国際数学オリンピックや国際情報学オリンピックなどの重要な学術競技でも金メダル級の成績を収めています。プロジェクトに参加したムスタファ・ロハニジャド氏は、ICPCでのパフォーマンスがこの成功シリーズの適切なまとめであり、システムの多機能性を指摘しました。さらに、次のステップとして新しい知識を見つけることができるシステムの開発に取り組む予定だと述べました。これは、真のマイルストーンとされています。
ポイント:
- 🏆 OpenAIのシステムは、2025年のICPC世界最終戦ですべての12の問題を完璧に解決し、人間とグーグルのDeepMindを上回りました。
- 🤖 このシステムはGPT-5と実験的モデルを組み合わせており、複雑な推論タスクにおける優位性を示しています。
- 📈 OpenAIはこの勝利をAI能力向上の象徴と見なし、今後新しい知識の発見を目指して探求を続ける予定です。
