AI奧賽金牌戰:OpenAI與谷歌DeepMind上演“氣氛”對決，誰是真贏家?

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 22, 2025

近日，人工智能領域兩大巨頭OpenAI和谷歌DeepMind相繼宣佈，其AI模型在2025年國際數學奧林匹克競賽（IMO）中榮獲金牌。這一成就不僅彰顯了人工智能系統驚人的發展速度，也意外點燃了兩家公司之間一場關乎“領先地位”認知的激烈競爭。

IMO作爲全球歷史最悠久、最具挑戰性的高中數學競賽之一，其結果被視爲衡量人工智能推理能力的重要基準。去年，谷歌以一個需要人工協助的“正式”系統在IMO中摘得銀牌。而今年，OpenAI和谷歌都推出了更先進的**“非正式”系統**，這些系統能夠直接從自然語言問題中提取信息，並生成有理有據的答案，無需人工轉換。兩家公司均聲稱，其AI模型在IMO考試中正確回答了六道題中的五道，超越了多數高中生和谷歌去年的AI模型表現。

機器人對決

推理模型突破與爭議

在接受採訪時，OpenAI和谷歌IMO項目的研究人員表示，這些金牌成績代表了AI推理模型在不可驗證領域的突破。這尤其重要，因爲傳統的AI推理模型擅長解決答案明確的問題（如簡單數學或編程），但在解決方案模糊的任務上(如協助複雜研究)則表現欠佳。

然而，圍繞此次金牌成績的**“誰先宣佈”和“如何宣佈”**，兩家公司爆發了激烈的爭執。OpenAI在週六早上率先公佈其AI模型獲得金牌的消息，此舉立即引來了谷歌DeepMind首席執行官和研究人員的批評。谷歌DeepMind高級研究員、IMO項目負責人Thang Luong向TechCrunch表示，谷歌選擇等待官方結果公佈是爲了尊重參賽學生，並已與國際數學奧林匹克組織者合作準備考試，並於週一上午才公佈了官方結果，該結果獲得了IMO主席和官方評分的支持。Luong強調:“國際數學奧林匹克組織者有自己的評分標準。所以，任何不基於該標準的評估都不能聲稱其成績達到了金牌水平。”

各執一詞，競爭白熱化

OpenAI參與IMO模型開發的Noam Brown則解釋稱，IMO數月前曾邀請OpenAI參加正式競賽，但因當時專注於開發更具研究價值的自然語言系統而婉拒。Brown表示，OpenAI並不知曉IMO正與谷歌進行非正式測試。OpenAI方面稱，他們聘請了三位熟悉評分系統的前IMO獎牌獲得者作爲第三方評估員，來評估其AI模型的表現。在得知金牌成績後，OpenAI聯繫了IMO，但IMO建議其等到週五晚上的頒獎典禮結束後再公佈結果。IMO方面尚未對TechCrunch的置評請求做出迴應。

儘管谷歌在程序上或許更爲嚴謹，但這場爭論的背後，是全球領先AI實驗室模型飛速進步的宏大圖景。今年全球頂尖高中生齊聚IMO，但只有少數人的得分能與OpenAI和谷歌的AI模型匹敵。這表明，曾經遙遙領先的OpenAI，如今正面臨着一場比以往任何時候都更加激烈的競爭。隨着OpenAI預計在未來幾個月發佈GPT-5，維持其在AI領域的領先地位形象，無疑是當前“氣氛”之戰的關鍵所在。

字節跳動開源 Seed-X:70億參數小模型支持28種語言翻譯，性能媲美頂級大模型

字節跳動開源輕量級多語言翻譯模型Seed-X，支持28種語言雙向翻譯，性能媲美頂級大模型。該70億參數模型基於Mistral架構，專注翻譯優化，在多個領域表現出色。採用創新訓練策略生成高質量數據，優化部署效率。這是字節繼BAGEL、Seed-Coder等之後又一開源項目，推動AI翻譯技術進步。

高通AI重磅發佈CSD-VAR：視覺自迴歸模型內容-風格分解新突破，解鎖創意生成新高度！

高通AI研究院推出創新技術CSD-VAR，通過內容-風格分解方法提升視覺自迴歸模型的生成能力。該技術採用尺度感知生成和SVD校正，實現內容與風格的精準分離，在保真度和風格化效果上優於傳統擴散模型。配套發佈的CSD-100數據集優化了模型訓練評估。CSD-VAR還引入K-V內存機制提升處理效率，在藝術創作、遊戲開發等領域應用前景廣闊，展現了高通在視覺生成技術上的領先地位。

Trae 2.0 正式升級 SOLO 模式：智能自主開發全流程集成一步到位

字節跳動推出Trae IDE 2.0版本，其革命性SOLO模式實現AI自主編程突破。該模式整合編輯器、終端等工具，能獨立完成從構思到部署的全流程開發，無需持續人工干預。測試顯示SOLO可自主開發並部署應用，如微信朋友圈分析工具。相比傳統AI編碼工具，Trae2.0提供更完整的端到端解決方案，超越同類競品。目前Pro用戶已可體驗該功能，需邀請碼解鎖。此次升級標誌着開發範式變革，爲AI與人類協作開闢新路徑。

智譜AI重磅推出Zread：一鍵將GitHub項目轉爲清晰使用手冊，開發者效率神器！

智譜AI推出Zread新功能，可將GitHub項目一鍵轉化爲結構化使用手冊。該功能無需複雜配置，能自動生成內容詳實、結構清晰的文檔，包含目錄導航和可視化圖表，大幅提升開發者理解開源項目的效率。Zread適用於不同水平的開發者，從項目概覽到深入使用都能提供幫助。這是智譜AI繼開源GLM系列模型後，在開發者工具領域的又一創新，展現了AI優化開發流程的潛力。目前該功能可免費體驗。

經濟學家警告：AI 泡沫或將比互聯網泡沫更嚴重

經濟學家警告當前AI泡沫風險超過90年代互聯網泡沫。標準普爾500前十公司市盈率創歷史新高，但盈利未同步增長，估值與基本面脫節。英偉達等科技巨頭在AI領域投入巨資，但收益遠未匹配支出。專家將當前AI熱潮比作次貸危機，指出市場存在過熱風險。儘管預測生成式AI市場將快速增長，但當前收入規模與鉅額投資相比仍微不足道，投資者需警惕潛在的市場調整風險。