近期,數學界見證了人工智能的一場里程碑式突破。前量化研究員 Neel Somani 在測試 GPT5.2 模型時發現,AI 僅需15分鐘思考,便給出了數學傳奇保羅·埃爾德什(Paul Erdős)未解難題的完整證明,其嚴謹性已通過 Lean 等形式化工具驗證。
長期以來,埃爾德什留下的1000多個數學猜想被視爲人類智慧的邊界。然而自去年聖誕節以來,該網站已有 15個問題被標記爲“已解決”,其中 11個方案明確有 AI 參與。

Somani 指出,GPT5.2在數學推理上表現出前所未有的熟練度。它不僅能熟練運用勒讓德公式等公理,甚至在哈佛數學家 Noam Elkies 既有研究的基礎上,給出了更完整的解決方案。這種對“長尾”數學難題的批量攻克,引發了 LLM 是否正拓展人類知識邊界的廣泛討論。
菲爾茲獎得主陶哲軒在其 GitHub 頁面上對這一進展進行了細緻統計,記錄了8個 AI 取得自主進展的案例。他推測,AI 的可擴展性使其在處理晦澀、簡單的“長尾”問題上比人類更具優勢。
除了模型本身的進化,形式化工具(如 Harmonic 公司的 Aristotle)的介入也至關重要。這些工具能將 AI 生成的推理自動轉化爲計算機可驗證的代碼,極大簡化了驗證過程。Harmonic 創始人 Tudor Achim 表示,相比解題數量,世界級數學教授開始公開承認使用 AI 工具,纔是證明 AI 實力的最有力證據。
