人工智能在純數學領域的表現正迎來質的飛躍。AIbase 獲悉,OpenAI 旗下的GPT-5.2Pro模型近日成功協助解決了數論領域的“埃爾德什難題”(Erdős problem)第281號。著名數學家陶哲軒(Terence Tao)對此給予了高度評價,稱其爲 AI 解決開放性數學問題中“最明確的案例之一”。

據瞭解,此次突破由研究員 Neel Somani 推動。雖然此前已有相關證明可能爲模型提供了背景參考,但陶哲軒在對比後確認,GPT-5.2Pro給出的證明過程與以往方法“截然不同”。AIbase 注意到,這並非該模型的首次嘗試,早在2026年1月4日,該模型就已實現過埃爾德什難題的自主解法。

然而,在狂歡之餘,數學界也保持着清醒的頭腦。陶哲軒警告稱,公衆對 AI 能力的認知可能存在偏差。由於失敗的嘗試很少被公佈,人們往往只看到成功的個例。AIbase 獲悉,一項由 Paata Ivanisvili 和 Mehmet Mars Seven 建立的追蹤數據庫顯示,AI 嘗試解決此類難題的實際成功率僅爲1% 到2%,且大多集中在難度較低的題目上。儘管如此,AI 作爲研究工具的潛力已不容小覷。

劃重點:

  • 🧠 突破性進展: GPT-5.2Pro成功破解數論難題 #281,其證明邏輯具有原創性,獲得了數學大師陶哲軒的認可。

  • 📊 成功率真相: 最新數據庫揭示 AI 解決此類難題的真實成功率僅約1%-2%,目前仍難以應對中高難度的複雜數學挑戰。

  • 🛠️ 科研新工具: 儘管並非萬能,但 AI 已被證實能提供不同於人類傳統路徑的解題思路,成爲數學研究的有力輔助。