在2025年的國際大學生程序設計競賽(ICPC)世界總決賽上,OpenAI 的系統表現出色,成功解決了比賽中所有12個編程問題,超越了人類選手和谷歌的 DeepMind 模型。根據 OpenAI 的說法,該系統若以人類團隊身份參賽,毫無疑問會奪得第一名。

代碼 互聯網 電腦

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

OpenAI 表示,該系統在比賽中遵循與學生相同的規則。它在標準的 PDF 格式中獲取問題集,並在五個小時的時間限制內提交解決方案。所有的提交都是直接發送給官方評審,評審與人類參賽隊伍的解答並行進行評估。公司強調,比賽期間沒有對系統進行特別調整。

這一消息發佈不久後,谷歌 DeepMind 聲稱其升級版的 Gemini2.5Deep Think 系統在同一比賽中達到了金牌水平,成功解決了12個問題中的10個,其中包括人類隊伍未能解決的 C 問題。不過,Gemini 在另外兩個問題上未能取得成功。相較之下,OpenAI 的系統以完美的12/12成績超越了 DeepMind 的表現。

OpenAI 解釋稱,該系統是由多個通用推理模型組成的集成體,這些模型並沒有特別針對 ICPC 進行訓練。它使用了 GPT-5和一個內部實驗性推理模型。GPT-5爲12個問題中的11個提供了正確答案,而實驗性模型負責選擇最終提交的答案。最後一個也是最難的問題是由實驗模型獨立解決的,這個問題經過了九次提交才最終被接受。與此對比,表現最佳的人類團隊僅解決了11個問題。

OpenAI 強調,這一勝利證明了更復雜的模型在深度推理和長時間計算能力方面的潛力。GPT-5承擔了大部分工作,突顯了它作爲當前公衆可用的最強大 AI 模型之一的地位。公司將這一成就視爲持續進步的結果。這些模型已經在國際數學奧林匹克和國際信息學奧林匹克等重要學術比賽中獲得了金級成績。項目參與者穆斯塔法・羅哈尼賈德表示,ICPC 的表現是這一成功系列的恰當總結,並指出系統的多功能性。他還補充說,下一步將是開發能夠發現新知識的系統,這被認爲是一個真正的里程碑。

劃重點:

- 🏆 OpenAI 的系統在2025年 ICPC 總決賽中完美解決所有12個問題,超越人類和谷歌 DeepMind。

- 🤖 系統結合了 GPT-5和一個實驗性模型,展現了其在複雜推理任務中的優勢。

- 📈 OpenAI 將此勝利視爲 AI 能力提升的標誌,未來將繼續探索新知識的發現。