GPT5.2震撼數學界:半個月攻克11道埃爾德什難題，陶哲軒發文點評

近期，數學界見證了人工智能的一場里程碑式突破。前量化研究員 Neel Somani 在測試 GPT5.2 模型時發現，AI 僅需15分鐘思考，便給出了數學傳奇保羅·埃爾德什（Paul Erdős）未解難題的完整證明，其嚴謹性已通過 Lean 等形式化工具驗證。

長期以來，埃爾德什留下的1000多個數學猜想被視爲人類智慧的邊界。然而自去年聖誕節以來，該網站已有 15個問題被標記爲“已解決”，其中 11個方案明確有 AI 參與。

機器人比賽答題數學

Somani 指出，GPT5.2在數學推理上表現出前所未有的熟練度。它不僅能熟練運用勒讓德公式等公理，甚至在哈佛數學家 Noam Elkies 既有研究的基礎上，給出了更完整的解決方案。這種對“長尾”數學難題的批量攻克，引發了 LLM 是否正拓展人類知識邊界的廣泛討論。

菲爾茲獎得主陶哲軒在其 GitHub 頁面上對這一進展進行了細緻統計，記錄了8個 AI 取得自主進展的案例。他推測，AI 的可擴展性使其在處理晦澀、簡單的“長尾”問題上比人類更具優勢。

除了模型本身的進化，形式化工具（如 Harmonic 公司的 Aristotle）的介入也至關重要。這些工具能將 AI 生成的推理自動轉化爲計算機可驗證的代碼，極大簡化了驗證過程。Harmonic 創始人 Tudor Achim 表示，相比解題數量，世界級數學教授開始公開承認使用 AI 工具，纔是證明 AI 實力的最有力證據。

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

畢馬威針對全球20國2145名高管的調查顯示，AI新的按量計費模式正讓企業高管們感到不安。過去依賴固定價格合同、由AI公司補貼算力成本的模式難以爲繼，隨着算力價格持續攀升，整個行業被迫轉向防守，企業低價使用AI的階段正走向終結。

GPT5.2震撼數學界:半個月攻克11道埃爾德什難題，陶哲軒發文點評

相關推薦

OpenAI炮轟AI評測"標杆"： 731 道題近三成有缺陷， 8 個月通過率從23%飆到80%已失靈

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案

全球首部AI女演員主演電影開機：沒有身體沒有童年，卻能調取全人類記憶

AI編碼圈再傳重磅：瑞典新星Lovable估值或將翻倍至 132 億美元

GPT5.2震撼數學界:半個月攻克11道埃爾德什難題，陶哲軒發文點評

相關推薦

OpenAI炮轟AI評測"標杆"： 731 道題近三成有缺陷， 8 個月通過率從23%飆到80%已失靈

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

​一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案

全球首部AI女演員主演電影開機：沒有身體沒有童年，卻能調取全人類記憶

AI編碼圈再傳重磅：瑞典新星Lovable估值或將翻倍至 132 億美元

一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案