谷歌DeepMind發佈了一項顛覆性研究成果——AlphaEvolve,一款結合Gemini大語言模型與進化算法的AI編碼代理。這款系統不僅能自動發現和優化複雜算法,還在谷歌的數據中心、芯片設計和AI訓練中展現了驚人實力,甚至助力Gemini模型自我優化,堪稱AI領域的“左腳踩右腳”式突破。AIbase深入剖析這一技術里程碑,揭示其核心原理與廣泛影響。

image.png

核心技術:Gemini與進化算法的完美融合

AlphaEvolve的核心在於其獨特的自進化框架,融合了谷歌Gemini系列大語言模型的創造力與自動化評估器的嚴謹性。其工作流程如下:

代碼生成:利用Gemini Flash(注重速度)和Gemini Pro(注重深度)生成多樣化的算法代碼,涵蓋從簡單函數到複雜程序的廣泛場景。

自動評估:生成的代碼經過自動化評估器驗證、運行並打分,確保正確性和效率。評估器根據性能指標篩選出優質代碼。

迭代進化:表現優異的代碼被保留、變異或組合,進入下一輪優化,類似生物進化中的“適者生存”。這一過程不斷迭代,最終產出創新性算法。

AIbase認爲,這種結合大語言模型與進化算法的設計,不僅克服了傳統LLM在代碼生成中的“幻覺”問題,還賦予了AlphaEvolve在複雜問題上的超強適應性,使其成爲算法發現的“超級大腦”。

數據中心優化:0.7%算力回收的驚人效益

AlphaEvolve在谷歌數據中心調度系統Borg中的應用堪稱亮點。它提出了一種高效的調度啓發式算法,平均回收了0.7%的全球算力資源,相當於數十萬臺機器的計算能力。這一優化已部署超過一年,爲谷歌節省了數百萬美元的運營成本,同時降低了能耗。AIbase分析指出,這一成果展示了AlphaEvolve在解決大規模系統優化問題上的巨大潛力。

芯片設計革新:TPU效率再升級

在硬件領域,AlphaEvolve爲谷歌下一代Tensor Processing Unit(TPU)提出了Verilog代碼優化建議,通過精簡關鍵算術電路中的冗餘比特,提升了芯片的面積和能效。所有優化均通過嚴格驗證,確保功能正確無誤。AIbase注意到,這一成果不僅加速了TPU的設計週期,還爲AI專用芯片的未來發展提供了新思路。

AI訓練提速:Gemini自我優化32.5%

AlphaEvolve在AI訓練優化上的表現尤爲引人注目。它針對Gemini模型訓練中的矩陣乘法核心操作進行了優化,提速23%,使整體訓練時間縮短1%。更令人震撼的是,AlphaEvolve通過優化GPU底層指令,將FlashAttention內核的運行效率提升了高達32.5%。AIbase認爲,這種“自我優化”能力標誌着AI研發進入了一個遞歸加速的新階段,Gemini通過AlphaEvolve變得更快、更強。

數學突破:破解50年難題與“親吻數”新解

AlphaEvolve不僅在工程應用中大放異彩,還在理論數學領域取得了突破。它發現了4x4複數矩陣乘法的新算法,打破了1969年以來Strassen算法的記錄。此外,在測試的50多個數學難題中,AlphaEvolve在75%的案例中重現了已知最優解,並在20%的案例中提出了更優解。其中,它在親吻數問題(kissing number problem)的11維空間中找到了593個球體的配置,打破了此前592的記錄。AIbase評價,這一成就彰顯了AlphaEvolve在基礎科學研究中的巨大潛力。

未來展望:從材料科學到藥物發現

谷歌DeepMind表示,AlphaEvolve的通用性使其適用於任何具有明確評估指標的問題,未來有望在材料科學、藥物發現和可持續發展等領域發揮作用。目前,谷歌正開發用戶界面,並計劃爲學術研究者推出早期訪問計劃,以進一步擴大其影響力。AIbase預測,隨着AlphaEvolve的開源或更廣泛應用,它可能成爲推動全球科研創新的關鍵引擎。

AI自進化開啓新紀元

作爲AI領域的專業媒體,AIbase認爲,AlphaEvolve的發佈不僅是谷歌DeepMind的又一力作,更是AI技術邁向自進化時代的重要標誌。其在數據中心、芯片設計、AI訓練和數學研究中的多領域突破,展現了AI從輔助工具向核心創新引擎的轉型。然而,AIbase也提醒,AlphaEvolve當前僅能處理可量化評估的問題,未來需進一步拓展其適用範圍。