谷歌最新版本的Gemini2.5Deep Think在2025年國際大學生程序設計競賽(ICPC)世界總決賽中創造歷史,不僅獲得金牌成績,還解決了所有人類隊伍都無法攻克的難題,標誌着人工智能在複雜問題解決能力上的重大突破。
競賽表現超越人類選手
9月4日在阿塞拜疆巴庫舉行的ICPC世界總決賽匯聚了來自100多個國家近3000所大學的精英選手,最終139支隊伍獲得參賽資格。在這場要求參賽者在5小時內解決12道算法難題的頂級賽事中,Gemini Deep Think展現了驚人的實力。
該AI系統按照官方規則在線上參賽,比人類隊伍晚10分鐘開始。令人矚目的是,它在45分鐘內就解決了8道題目,並在3小時內完成另外2道,總計用時677分鐘解決10道題目,這一成績在人類選手中可排名第二。
最引人注目的是,Gemini Deep Think成功解決了問題C——這道關於通過可配置管道和儲液器網絡最大化液體分配系統效率的複雜題目,沒有一支人類隊伍能夠攻克。該任務要求系統在幾乎無限的可能性中找到最快的填充策略,展現了AI在抽象推理方面的突破性進展。

技術突破的背後
據谷歌DeepMind介紹,這一成功源於預訓練、後訓練、高級強化學習方法、多步邏輯推理和並行問題求解等多個方面的綜合進步。在強化學習過程中,模型接受了極其困難的編程任務訓練,多個Gemini代理生成不同候選解決方案,在虛擬終端中測試並不斷迭代改進。
這一版本直接基於幾周前在國際數學奧林匹克競賽(IMO)上奪得金牌的Gemini2.5Deep Think構建,顯示了谷歌在AI推理能力上的快速迭代和提升。
產業意義與未來展望
ICPC執行董事Bill Poucher博士將此稱爲轉折點:"Gemini成功加入這一領域並取得黃金級成果,標誌着定義下一代所需的人工智能工具和學術標準的關鍵時刻。"他強調,分解複雜問題、設計多步驟策略並正確實施的能力不僅在編程中重要,在藥物發現、芯片設計和更廣泛的研究領域同樣至關重要。
谷歌DeepMind表示,Gemini可作爲開發者的合作伙伴,理論上,人類和AI結合最佳解決方案能夠解決所有12個競賽問題。目前,Gemini2.5Deep Think的輕量版已通過Gemini應用向Google AI Ultra計劃用戶開放,未來版本預計將發展成爲更強大的編程助手,應用於軟件開發、物流和科學研究等領域。
AI奧林匹克競賽白熱化
這一突破緊隨OpenAI的重大成功。2025年8月,OpenAI系統在國際信息學奧林匹克競賽(IOI)上奪得金牌,在330名人類參賽者中僅有5人表現超過它。與Gemini類似,這一結果同樣來自通用推理模型而非高度定製的系統,顯示了AI推理能力的快速發展。
谷歌在大學級ICPC競賽上的金牌成績進一步升級了AI競賽的激烈程度,預計OpenAI也可能派出系統參與這一頂級賽事的競爭。
