在賓夕法尼亞大學,有位數學教授 Robert Ghrist 正在與一款名爲 GPT-o1-mini 的 AI 模型展開一場有趣的 “智力對決”。這位教授在努力推導出一個更復雜的瓶頸對偶定理的推廣時,經歷了無數次的樂觀與沮喪的交替。
Ghrist 曾嘗試使用多個知名的 AI 模型,包括 GPT-4、Claude-3.5和 Gemini-1.5-Pro。這些模型雖然能做出一些假設並提供證據,但常常因一些微妙的錯誤而 “翻車”,這讓 Ghrist 感到頗爲挫敗。最終,他與 OpenAI 的 GPT-o1-mini 模型攜手,取得了突破。這個模型不僅分析了一個有缺陷的證明,找出了錯誤,還在短短43秒內生成了一個 “全新且巧妙的正確證明”,其優雅程度竟超過了人類的版本。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
GPT-o1-mini 在邏輯任務中表現出色,採用了連鎖思維技術,雖然它在邏輯和規劃基準測試中超越了傳統語言模型,但仍舊存在錯誤的可能性。Ghrist 對這次經歷的總結是:“結果正好處於大型語言模型(LLM)能否證明的邊界上。” 他解釋說,識別模型的失敗模式是這次實驗的關鍵。
儘管獲得了成功,Ghrist 也坦承,使用 AI 的過程並不一定比全靠自己來得更快。他甚至表示,依靠這些模型的幫助,最終的論文效果反而更佳。他的論文中還附上了一個附錄,詳細記錄了 AI 模型在成果中的作用。
不過,事情並非總是一帆風順。就在論文發表後不久,另一位數學家 Sridhar Ramesh 在社交媒體上指出,其實這個證明可以通過 Birkhoff 的一個定理輕鬆完成,這讓 Ghrist 頗感意外。他幽默地承認道:“人類獲勝了……” 這次與 AI 的合作,雖然收穫了成果,但也讓他意識到,有時候人類的智慧纔是最有效的解決方案。