OpenAI 系統在全球頂級編程大賽中戰勝人類和谷歌

在2025年的國際大學生程序設計競賽（ICPC）世界總決賽上，OpenAI 的系統表現出色，成功解決了比賽中所有12個編程問題，超越了人類選手和谷歌的 DeepMind 模型。根據 OpenAI 的說法，該系統若以人類團隊身份參賽，毫無疑問會奪得第一名。

代碼互聯網電腦

圖源備註:圖片由AI生成，圖片授權服務商Midjourney

OpenAI 表示，該系統在比賽中遵循與學生相同的規則。它在標準的 PDF 格式中獲取問題集，並在五個小時的時間限制內提交解決方案。所有的提交都是直接發送給官方評審，評審與人類參賽隊伍的解答並行進行評估。公司強調，比賽期間沒有對系統進行特別調整。

這一消息發佈不久後，谷歌 DeepMind 聲稱其升級版的 Gemini2.5Deep Think 系統在同一比賽中達到了金牌水平，成功解決了12個問題中的10個，其中包括人類隊伍未能解決的 C 問題。不過，Gemini 在另外兩個問題上未能取得成功。相較之下，OpenAI 的系統以完美的12/12成績超越了 DeepMind 的表現。

OpenAI 解釋稱，該系統是由多個通用推理模型組成的集成體，這些模型並沒有特別針對 ICPC 進行訓練。它使用了 GPT-5和一個內部實驗性推理模型。GPT-5爲12個問題中的11個提供了正確答案，而實驗性模型負責選擇最終提交的答案。最後一個也是最難的問題是由實驗模型獨立解決的，這個問題經過了九次提交才最終被接受。與此對比，表現最佳的人類團隊僅解決了11個問題。

OpenAI 強調，這一勝利證明了更復雜的模型在深度推理和長時間計算能力方面的潛力。GPT-5承擔了大部分工作，突顯了它作爲當前公衆可用的最強大 AI 模型之一的地位。公司將這一成就視爲持續進步的結果。這些模型已經在國際數學奧林匹克和國際信息學奧林匹克等重要學術比賽中獲得了金級成績。項目參與者穆斯塔法・羅哈尼賈德表示，ICPC 的表現是這一成功系列的恰當總結，並指出系統的多功能性。他還補充說，下一步將是開發能夠發現新知識的系統，這被認爲是一個真正的里程碑。

劃重點:
- 🏆 OpenAI 的系統在2025年 ICPC 總決賽中完美解決所有12個問題，超越人類和谷歌 DeepMind。
- 🤖 系統結合了 GPT-5和一個實驗性模型，展現了其在複雜推理任務中的優勢。
- 📈 OpenAI 將此勝利視爲 AI 能力提升的標誌，未來將繼續探索新知識的發現。

拒絕空談承諾！多國政府推行大模型“發佈前安全評估”新機制

隨着全球AI爆發式發展，多國政府將大模型監管從原則性宣言轉向實質性落地。英國、美國和澳大利亞近期要求前沿AI模型在公開發布前，必須通過政府主導的安全漏洞與風險邊界測試。英國AI安全研究院提出的紅隊測試與風險評估流程成爲全球政策樣板。

Hyper3D Rodin Gen-2.5 發佈：4 秒百萬面、全球首款千萬面級 3D 生成模型，細節直逼生產級資產

3D生成AI領域迎來重大突破，Hyper3D發佈Rodin Gen-2.5模型，號稱全球最強。該模型實現4秒生成百萬面模型，並首次達到千萬面級3D生成，細節可呈現毛孔和皮膚微結構。其核心創新是引入自適應思考努力機制，根據任務複雜度動態調整計算資源，標誌着AI3D從“能看”邁向“能用”階段。

隱藏的惡意“週報”！微軟 Copilot 曝間接提示詞注入漏洞風險

微軟Microsoft 365的AI助手Copilot Cowork被曝存在嚴重安全漏洞，攻擊者通過“間接提示詞注入”技術，在辦公模板中植入惡意指令，無需用戶批准即可竊取並外泄企業雲盤機密文件，還能代替用戶發送郵件、發佈Teams消息，威脅組織數據安全。

奔騰 4 復活賽：20 年前“古董”CPU 竟能跑通 Meta Llama 3 大模型

YouTube科技頻道Fully Buffered近日成功在2006年的奔騰4 641處理器上運行了Meta最新的Llama 3.2 3B大模型，將現代AI與20年前老舊硬件結合，展現了LLM的底層兼容性極限。這一硬核測試引發網友感慨，摩爾定律在AI時代的進化速度以跨時空方式實現“握手”，堪稱硬件“考古”的極致配置。

OpenAI 系統在全球頂級編程大賽中戰勝人類和谷歌

相關推薦

人類對局體驗再升級！免費開源 AI 國際象棋引擎 Maia 3 正式發佈

拒絕空談承諾！多國政府推行大模型“發佈前安全評估”新機制

Hyper3D Rodin Gen-2.5 發佈：4 秒百萬面、全球首款千萬面級 3D 生成模型，細節直逼生產級資產

隱藏的惡意“週報”！微軟 Copilot 曝間接提示詞注入漏洞風險

奔騰 4 復活賽：20 年前“古董”CPU 竟能跑通 Meta Llama 3 大模型

​OpenAI 系統在全球頂級編程大賽中戰勝人類和谷歌

相關推薦

人類對局體驗再升級！免費開源 AI 國際象棋引擎 Maia 3 正式發佈

拒絕空談承諾！多國政府推行大模型“發佈前安全評估”新機制

Hyper3D Rodin Gen-2.5 發佈：4 秒百萬面、全球首款千萬面級 3D 生成模型，細節直逼生產級資產

隱藏的惡意“週報”！微軟 Copilot 曝間接提示詞注入漏洞風險

奔騰 4 復活賽：20 年前“古董”CPU 竟能跑通 Meta Llama 3 大模型

OpenAI 系統在全球頂級編程大賽中戰勝人類和谷歌