数学界震动！OpenAI GPT-5.2 Pro 攻克埃尔德什难题，陶哲轩点赞

人工智能在纯数学领域的表现正迎来质的飞跃。AIbase 获悉，OpenAI 旗下的GPT-5.2Pro模型近日成功协助解决了数论领域的“埃尔德什难题”（Erdős problem）第281号。著名数学家陶哲轩(Terence Tao)对此给予了高度评价，称其为 AI 解决开放性数学问题中“最明确的案例之一”。

据了解，此次突破由研究员 Neel Somani 推动。虽然此前已有相关证明可能为模型提供了背景参考，但陶哲轩在对比后确认，GPT-5.2Pro给出的证明过程与以往方法“截然不同”。AIbase 注意到，这并非该模型的首次尝试，早在2026年1月4日，该模型就已实现过埃尔德什难题的自主解法。

然而，在狂欢之余，数学界也保持着清醒的头脑。陶哲轩警告称，公众对 AI 能力的认知可能存在偏差。由于失败的尝试很少被公布，人们往往只看到成功的个例。AIbase 获悉，一项由 Paata Ivanisvili 和 Mehmet Mars Seven 建立的追踪数据库显示，AI 尝试解决此类难题的实际成功率仅为1% 到2%，且大多集中在难度较低的题目上。尽管如此，AI 作为研究工具的潜力已不容小觑。

划重点:

🧠 突破性进展: GPT-5.2Pro成功破解数论难题 #281，其证明逻辑具有原创性，获得了数学大师陶哲轩的认可。
📊 成功率真相: 最新数据库揭示 AI 解决此类难题的真实成功率仅约1%-2%，目前仍难以应对中高难度的复杂数学挑战。
🛠️ 科研新工具: 尽管并非万能，但 AI 已被证实能提供不同于人类传统路径的解题思路，成为数学研究的有力辅助。

太空数据砸进AI！马斯克掏出SpaceX家底， 2 万亿参数Grok大模型即刻炼成

马斯克宣布将SpaceX自2002年积累的制造工艺、材料科学及星链硬件设计等海量工程数据，用于训练下一代Grok大模型，以打造更强AI。受出口管制限制，火箭发动机、制导控制等国防敏感技术已被严格剔除，确保合规。此举展现了其跨界整合尖端资源的能力。

数学界震动！OpenAI GPT-5.2 Pro 攻克埃尔德什难题，陶哲轩点赞

相关推荐

三星计划投资 Mistral AI，力求打破美国科技巨头的垄断

OpenRouter把语音转录塞进同一个API：一份key搞定聊天和转写，Whisper与按token计价STT一并接入

太空数据砸进AI！马斯克掏出SpaceX家底， 2 万亿参数Grok大模型即刻炼成

真假视频一鉴便知！英伟达推出SVD检测服务，识别AI造假准确率高达92%

Substack 接入 Pangram 检测工具，上线网页与移动端 AI 文本识别功能

数学界震动！OpenAI GPT-5.2 Pro 攻克埃尔德什难题，陶哲轩点赞

相关推荐

​三星计划投资 Mistral AI，力求打破美国科技巨头的垄断

OpenRouter把语音转录塞进同一个API：一份key搞定聊天和转写，Whisper与按token计价STT一并接入

太空数据砸进AI！马斯克掏出SpaceX家底， 2 万亿参数Grok大模型即刻炼成

真假视频一鉴便知！英伟达推出SVD检测服务，识别AI造假准确率高达92%

Substack 接入 Pangram 检测工具，上线网页与移动端 AI 文本识别功能

三星计划投资 Mistral AI，力求打破美国科技巨头的垄断