人工智能在纯数学领域的表现正迎来质的飞跃。AIbase 获悉,OpenAI 旗下的GPT-5.2Pro模型近日成功协助解决了数论领域的“埃尔德什难题”(Erdős problem)第281号。著名数学家陶哲轩(Terence Tao)对此给予了高度评价,称其为 AI 解决开放性数学问题中“最明确的案例之一”。

据了解,此次突破由研究员 Neel Somani 推动。虽然此前已有相关证明可能为模型提供了背景参考,但陶哲轩在对比后确认,GPT-5.2Pro给出的证明过程与以往方法“截然不同”。AIbase 注意到,这并非该模型的首次尝试,早在2026年1月4日,该模型就已实现过埃尔德什难题的自主解法。

然而,在狂欢之余,数学界也保持着清醒的头脑。陶哲轩警告称,公众对 AI 能力的认知可能存在偏差。由于失败的尝试很少被公布,人们往往只看到成功的个例。AIbase 获悉,一项由 Paata Ivanisvili 和 Mehmet Mars Seven 建立的追踪数据库显示,AI 尝试解决此类难题的实际成功率仅为1% 到2%,且大多集中在难度较低的题目上。尽管如此,AI 作为研究工具的潜力已不容小觑。

划重点:

  • 🧠 突破性进展: GPT-5.2Pro成功破解数论难题 #281,其证明逻辑具有原创性,获得了数学大师陶哲轩的认可。

  • 📊 成功率真相: 最新数据库揭示 AI 解决此类难题的真实成功率仅约1%-2%,目前仍难以应对中高难度的复杂数学挑战。

  • 🛠️ 科研新工具: 尽管并非万能,但 AI 已被证实能提供不同于人类传统路径的解题思路,成为数学研究的有力辅助。