5月26日,Anthropic 工程師 Sholto Douglas 在 X 平臺宣佈,其最新模型 Claude Mythos 成功通過一個“巧妙而簡潔的證明”解決了組合幾何領域的百年曆史難題——Erdős 單位距離猜想。這一突破緊隨 OpenAI 日前利用 GPT-5.5攻克該里程碑式數學難題之後,標誌着頭部 AI 廠商在純數學發現領域的競爭已進入白熱化階段。

此次突破展現了不同於傳統單一模型的智能體協同範式。據悉,團隊構建了一個包含多個獨立 Claude Code 實例的自動化測試系統。在該系統內,具備 Mythos 訪問權限的智能體實例負責接收問題並生成不同的解決方案路徑,隨後由另一個實例進行彙總並分發給其餘獨立運行的實例進行交叉驗證。
儘管數學家 Daniel Litt 評價 Mythos 的初始結果在絕對表現上“略遜於” OpenAI 的解法,但該模型最終成功找到了與 OpenAI 相同的解題路徑,並且獨立推導出了更具獨創性的精簡證明。目前,Anthropic 已正式發佈由 Opus4.7整理完成的證明版本。
這一進展再次引發了行業對於“純大語言模型(LLM)”與“符號推理輔助系統”發展路線的討論。此前,谷歌 DeepMind 曾宣佈利用其 AlphaProof Nexus 系統攻克了9個 Erdős 問題,但因其高度依賴 Lean 形式化證明語言,在純粹的生成式 AI 領域引發了關於自主推理含金量的爭議。
相比之下,Claude Code 作爲一種智能體(Agent)框架,正通過多智能體協同攻克人類頂級科學難題。當前 AI 領域正經歷劇烈的範式變革,菲爾茲獎得主近日亦證實 ChatGPT5.5Pro 已能在兩小時內自主完成博士級數學研究。隨着 Claude Mythos 與 GPT-5.5在算法發現和系統漏洞利用等前沿領域展現出自主演進能力,AI 正在從早期的“提示詞工程”階段全面邁向具備深度邏輯推理與科學探索能力的自主智能體時代。
