著名數學家陶哲軒表示,儘管人工智能在許多領域展現出驚人能力,但在數學領域,它仍然缺乏一種關鍵的“嗅覺”——即辨別錯誤方向和錯誤證明的人類直覺。他認爲,這種直覺是人工智能目前無法複製的,也因此,人類在數學判斷中依然扮演着不可替代的角色。

陶哲軒指出,生成式人工智能在生成數學證明時,即使存在缺陷,表面上看起來也往往“完美無缺”。然而,這些錯誤通常“非常微妙”,而且在發現時會顯得“非常愚蠢”,是人類在實際操作中不會犯的低級錯誤。他將這種人類獨有的能力稱爲“隱喻性的數學氣味”,它能在某件事情不對勁時立刻發出警告。陶哲軒強調:“目前還不清楚如何讓人工智能最終複製這種能力。”

機器人比賽 答題 數學

他進一步解釋說,當前人工智能,特別是生成模型,在採用錯誤方法時往往會陷入困境。他認爲,人工智能目前真正難以解決的問題在於“它何時走錯了方向”。這與將神經網絡與符號推理相結合的混合人工智能系統有所不同。

儘管如此,陶哲軒也承認,像 AlphaZero 這樣的系統在圍棋和國際象棋等領域已經取得了顯著進步。他認爲,這些系統在某種意義上已經發展出了對棋局的“嗅覺”,能夠判斷某個局面是否對一方有利。雖然它們無法推斷出具體原因,但這種“嗅覺”足以讓它們制定策略。陶哲軒設想,如果人工智能能夠獲得這種感知某些證明策略可行性的能力,它就能在分解問題時給出建設性建議,例如:“嗯,這看起來不錯;這兩個任務看起來比你的主要任務簡單,而且它們仍然很有可能是正確的。”

據悉,AlphaZero 在遊戲和訓練過程中通過蒙特卡洛樹搜索(MCTS)作爲“符號框架”來選擇走法,將可能的遊戲路徑探索爲符號狀態。但其本質上仍是由神經網絡驅動的深度強化學習系統,通過自我對弈並從數百萬個參數中學習。

一些研究人員認爲,將大型語言模型與符號推理的優勢相結合,有望推動人工智能在數學領域取得重大突破,因爲純粹的 LLM(即使具有一定推理能力)也可能會在複雜的數學問題上走進死衚衕。陶哲軒此前曾將 OpenAI 的推理模型 o1描述爲“平庸,但並非完全無能”,認爲它就像一個能夠處理日常任務的研究助理,但仍然缺乏創造力和靈活性。他還參與了 FrontierMath 基準的開發,該基準爲人工智能系統設定了極具挑戰性的數學問題,以期推動該領域的發展。