近日,OpenAI 研究員 Sheryl Hsu 在社交媒體上宣佈,OpenAI 內部開發的 AI 推理系統在2025年國際信息學奧林匹克競賽(IOI)中取得了金牌,這是 AI 首次在這一領域達到如此高的水平。在與330名頂尖人類選手的激烈競爭中,該 AI 系統的表現超越了98% 的選手,僅有5位人類選手的成績高於它。

image.png

Sheryl Hsu 特別強調,這套 AI 系統是在嚴格的模擬人類選手環境下進行比賽的。爲了確保比賽的公平性,AI 完全斷網,無法訪問互聯網,也無法調用外部知識庫,所有解題邏輯必須由 AI 自身生成。這意味着它的解題過程完全依賴於自身的邏輯推理和問題解決能力。

與人類選手相同,這套 AI 系統也受到了一定的限制,包括5小時的比賽時間和50次代碼提交的機會。同時,AI 只能使用一個基礎的終端工具,確保在封閉且高壓的環境下與人類選手公平對決。

OpenAI 表示,該 AI 系統並不是專門針對 IOI 競賽進行的訓練,而是使用了一個通用推理模型的集成系統。在比賽中,團隊的人工干預主要限於從模型生成的多個解法中選擇最優解,以及將模型與 IOI 的提交 API 進行連接。除這些外,AI 在解題過程中的所有步驟均由其自主完成。

回顧去年的 IOI 競賽,OpenAI 曾嘗試參賽,但未能取得理想的成績,最終與銅牌擦肩而過,僅排在49% 的分位。然而,僅僅一年後,OpenAI 實現了從49% 分位到98% 分位的巨大飛躍,成功奪得金牌。

近來,OpenAI 的內部推理系統在多個世界級智力競賽中接連傳來佳績:在 AtCoder 世界總決賽中獲得第二名,並在2025年國際數學奧林匹克競賽中也宣稱獲得金牌。這一系列成績引發了外界對該系統的更多關注,也讓人們對 OpenAI 在下半年可能推出的新模型充滿期待。

劃重點:

🌟 AI 推理系統在2025年 IOI 競賽中奪得金牌,表現超越98% 人類選手。

💻 AI 比賽時完全斷網,所有解題邏輯由自身生成,確保公平性。

🏆 去年未能獲獎,今年實現質的飛躍,從49% 分位躍升至金牌。