谷歌 DeepMind 研究實驗室最新推出的 AI 系統 AlphaGeometry2,在解決幾何問題方面表現出色,超越了國際數學奧林匹克(IMO)比賽中的平均金牌得主。該系統被認爲是 AlphaGeometry 的改進版本,研究人員表示,AlphaGeometry2能夠解決過去25年 IMO 中84% 的幾何問題。

image.png

爲什麼 DeepMind 會關注這樣的高中數學競賽呢?他們認爲,尋找解決複雜幾何問題的新方法,特別是歐幾里得幾何,可能是提升 AI 能力的關鍵。證明數學定理或解釋定理(如勾股定理)爲何成立,需要邏輯推理和選擇多個可能步驟的能力。如果 DeepMind 的理論成立,這些問題解決能力將對未來的通用 AI 模型非常重要。

今年夏天,DeepMind 展示了結合了 AlphaGeometry2與數學推理 AI 模型 AlphaProof 的系統,該系統在2024年 IMO 的六個問題中解決了四個。除了幾何問題,這種方法還可以擴展到其他數學和科學領域,例如複雜的工程計算。

AlphaGeometry2的核心組成部分包括來自谷歌 Gemini 系列的語言模型和一個 “符號引擎”。Gemini 模型幫助符號引擎通過數學規則推導出問題的可行解。IMO 的幾何問題通常基於需要添加 “構造” 的圖形,例如點、線或圓。AlphaGeometry2的 Gemini 模型能夠預測哪些構造可能對解決問題有幫助。

值得注意的是,AlphaGeometry2在解決 IMO 問題時,使用了 DeepMind 自己生成的超過3億個定理和證明的合成數據進行訓練。研究團隊選擇了過去25年中 IMO 的45個幾何問題,並進行了擴展,最終形成了50個問題集。AlphaGeometry2成功解決了其中的42個,超越了金牌得主的平均得分。

不過,AlphaGeometry2仍存在一些侷限性,例如它無法解決具有可變數量點、非線性方程和不等式的問題。儘管如此,這項研究仍然引發了關於 AI 系統應該基於符號操作還是神經網絡的討論。AlphaGeometry2採用了一種混合方法,結合了神經網絡和基於規則的符號引擎。

AlphaGeometry2的成功爲通用 AI 的未來發展提供了新的方向。儘管目前尚未完全自給自足,但 DeepMind 團隊的研究表明,未來可能會有更多自足的 AI 模型問世。

論文入口:https://arxiv.org/pdf/2502.03544

劃重點:

📊 AlphaGeometry2能夠解決過去25年 IMO 中84% 的幾何問題,超越了金牌得主的平均得分。  

🔍 該系統結合了神經網絡和符號引擎,採用混合方法解決複雜數學問題。  

📈 DeepMind 希望通過解決幾何問題,推動更強大通用 AI 的研究進展。