近日,人工智能領域兩大巨頭OpenAI和谷歌DeepMind相繼宣佈,其AI模型在2025年國際數學奧林匹克競賽(IMO)中榮獲金牌。這一成就不僅彰顯了人工智能系統驚人的發展速度,也意外點燃了兩家公司之間一場關乎“領先地位”認知的激烈競爭。
IMO作爲全球歷史最悠久、最具挑戰性的高中數學競賽之一,其結果被視爲衡量人工智能推理能力的重要基準。去年,谷歌以一個需要人工協助的“正式”系統在IMO中摘得銀牌。而今年,OpenAI和谷歌都推出了更先進的**“非正式”系統**,這些系統能夠直接從自然語言問題中提取信息,並生成有理有據的答案,無需人工轉換。兩家公司均聲稱,其AI模型在IMO考試中正確回答了六道題中的五道,超越了多數高中生和谷歌去年的AI模型表現。
推理模型突破與爭議
在接受採訪時,OpenAI和谷歌IMO項目的研究人員表示,這些金牌成績代表了AI推理模型在不可驗證領域的突破。這尤其重要,因爲傳統的AI推理模型擅長解決答案明確的問題(如簡單數學或編程),但在解決方案模糊的任務上(如協助複雜研究)則表現欠佳。
然而,圍繞此次金牌成績的**“誰先宣佈”和“如何宣佈”**,兩家公司爆發了激烈的爭執。OpenAI在週六早上率先公佈其AI模型獲得金牌的消息,此舉立即引來了谷歌DeepMind首席執行官和研究人員的批評。谷歌DeepMind高級研究員、IMO項目負責人Thang Luong向TechCrunch表示,谷歌選擇等待官方結果公佈是爲了尊重參賽學生,並已與國際數學奧林匹克組織者合作準備考試,並於週一上午才公佈了官方結果,該結果獲得了IMO主席和官方評分的支持。Luong強調:“國際數學奧林匹克組織者有自己的評分標準。所以,任何不基於該標準的評估都不能聲稱其成績達到了金牌水平。”
各執一詞,競爭白熱化
OpenAI參與IMO模型開發的Noam Brown則解釋稱,IMO數月前曾邀請OpenAI參加正式競賽,但因當時專注於開發更具研究價值的自然語言系統而婉拒。Brown表示,OpenAI並不知曉IMO正與谷歌進行非正式測試。OpenAI方面稱,他們聘請了三位熟悉評分系統的前IMO獎牌獲得者作爲第三方評估員,來評估其AI模型的表現。在得知金牌成績後,OpenAI聯繫了IMO,但IMO建議其等到週五晚上的頒獎典禮結束後再公佈結果。IMO方面尚未對TechCrunch的置評請求做出迴應。
儘管谷歌在程序上或許更爲嚴謹,但這場爭論的背後,是全球領先AI實驗室模型飛速進步的宏大圖景。今年全球頂尖高中生齊聚IMO,但只有少數人的得分能與OpenAI和谷歌的AI模型匹敵。這表明,曾經遙遙領先的OpenAI,如今正面臨着一場比以往任何時候都更加激烈的競爭。隨着OpenAI預計在未來幾個月發佈GPT-5,維持其在AI領域的領先地位形象,無疑是當前“氣氛”之戰的關鍵所在。