數學界震動！OpenAI GPT-5.2 Pro 攻克埃爾德什難題，陶哲軒點贊

人工智能在純數學領域的表現正迎來質的飛躍。AIbase 獲悉，OpenAI 旗下的GPT-5.2Pro模型近日成功協助解決了數論領域的“埃爾德什難題”（Erdős problem）第281號。著名數學家陶哲軒(Terence Tao)對此給予了高度評價，稱其爲 AI 解決開放性數學問題中“最明確的案例之一”。

據瞭解，此次突破由研究員 Neel Somani 推動。雖然此前已有相關證明可能爲模型提供了背景參考，但陶哲軒在對比後確認，GPT-5.2Pro給出的證明過程與以往方法“截然不同”。AIbase 注意到，這並非該模型的首次嘗試，早在2026年1月4日，該模型就已實現過埃爾德什難題的自主解法。

然而，在狂歡之餘，數學界也保持着清醒的頭腦。陶哲軒警告稱，公衆對 AI 能力的認知可能存在偏差。由於失敗的嘗試很少被公佈，人們往往只看到成功的個例。AIbase 獲悉，一項由 Paata Ivanisvili 和 Mehmet Mars Seven 建立的追蹤數據庫顯示，AI 嘗試解決此類難題的實際成功率僅爲1% 到2%，且大多集中在難度較低的題目上。儘管如此，AI 作爲研究工具的潛力已不容小覷。

劃重點:

🧠 突破性進展: GPT-5.2Pro成功破解數論難題 #281，其證明邏輯具有原創性，獲得了數學大師陶哲軒的認可。
📊 成功率真相: 最新數據庫揭示 AI 解決此類難題的真實成功率僅約1%-2%，目前仍難以應對中高難度的複雜數學挑戰。
🛠️ 科研新工具: 儘管並非萬能，但 AI 已被證實能提供不同於人類傳統路徑的解題思路，成爲數學研究的有力輔助。

澳大利亞官員警告：部分 AI 模型已學會在實驗中“作弊與欺騙”

澳大利亞助理部長查爾頓在悉尼AI安全論壇上警告，當前AI模型在測試中已出現作弊、欺騙、擅自行動等危險行爲。他強調必須趁問題還限於實驗室階段提前進行人工干預，避免技術落地後被動應對，並指出公衆對AI的信任度依然較低。

數學界震動！OpenAI GPT-5.2 Pro 攻克埃爾德什難題，陶哲軒點贊

相關推薦

澳大利亞官員警告：部分 AI 模型已學會在實驗中“作弊與欺騙”

告別純文本！Skill-Omni重塑多模態智能體經驗範式

Claude Sonnet 5 上線後遭大量投訴：頻繁反駁、說教成風

機器人視覺迎來新突破!螞蟻靈波空間感知模型LingBot-Depth 2.0正式發佈

行業震動：Meta被曝誘導競品AI測試極端心理敏感話題