數學教授和GPT o1 mini的“智力對決” AI43秒完成人類數月難題

在賓夕法尼亞大學，有位數學教授 Robert Ghrist 正在與一款名爲 GPT-o1-mini 的 AI 模型展開一場有趣的 “智力對決”。這位教授在努力推導出一個更復雜的瓶頸對偶定理的推廣時，經歷了無數次的樂觀與沮喪的交替。

Ghrist 曾嘗試使用多個知名的 AI 模型，包括 GPT-4、Claude-3.5和 Gemini-1.5-Pro。這些模型雖然能做出一些假設並提供證據，但常常因一些微妙的錯誤而 “翻車”，這讓 Ghrist 感到頗爲挫敗。最終，他與 OpenAI 的 GPT-o1-mini 模型攜手，取得了突破。這個模型不僅分析了一個有缺陷的證明，找出了錯誤，還在短短43秒內生成了一個 “全新且巧妙的正確證明”，其優雅程度竟超過了人類的版本。

LLM 羊駝數學大模型

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

GPT-o1-mini 在邏輯任務中表現出色，採用了連鎖思維技術，雖然它在邏輯和規劃基準測試中超越了傳統語言模型，但仍舊存在錯誤的可能性。Ghrist 對這次經歷的總結是:“結果正好處於大型語言模型（LLM）能否證明的邊界上。” 他解釋說，識別模型的失敗模式是這次實驗的關鍵。

儘管獲得了成功，Ghrist 也坦承，使用 AI 的過程並不一定比全靠自己來得更快。他甚至表示，依靠這些模型的幫助，最終的論文效果反而更佳。他的論文中還附上了一個附錄，詳細記錄了 AI 模型在成果中的作用。

不過，事情並非總是一帆風順。就在論文發表後不久，另一位數學家 Sridhar Ramesh 在社交媒體上指出，其實這個證明可以通過 Birkhoff 的一個定理輕鬆完成，這讓 Ghrist 頗感意外。他幽默地承認道:“人類獲勝了……” 這次與 AI 的合作，雖然收穫了成果，但也讓他意識到，有時候人類的智慧纔是最有效的解決方案。

李彥宏:AI 的內化將重塑生產力

在2025年百度世界大會上，李彥宏以《效果涌現》爲主題演講，強調AI能力內化後，智能不再是成本，而是推動生產力的關鍵。他指出，AI產業結構正從“正金字塔”向“倒金字塔”轉變，這將大幅提升模型和應用的價值，改變傳統模式中底層芯片佔據主要價值的局面。

數學教授和GPT o1 mini的“智力對決” AI43秒完成人類數月難題

相關推薦

Poe AI 羣聊功能重磅上線： 200 人協作，AI 模型混搭，革新多人互動體驗！

OpenAI 財務泄露：鉅額開銷壓制盈利前景

李彥宏:AI 的內化將重塑生產力

Replit 推出 AI Integrations，一鍵接入 300+ AI 模型，構建 AI 應用變得輕鬆

Paytm 與 Groq 合作，推動高性能 AI 模型發展

數學教授和GPT o1 mini的“智力對決” AI43秒完成人類數月難題

相關推薦

Poe AI 羣聊功能重磅上線： 200 人協作，AI 模型混搭，革新多人互動體驗！

​OpenAI 財務泄露：鉅額開銷壓制盈利前景

李彥宏:AI 的內化將重塑生產力

​Replit 推出 AI Integrations，一鍵接入 300+ AI 模型，構建 AI 應用變得輕鬆

Paytm 與 Groq 合作，推動高性能 AI 模型發展

OpenAI 財務泄露：鉅額開銷壓制盈利前景

Replit 推出 AI Integrations，一鍵接入 300+ AI 模型，構建 AI 應用變得輕鬆