近日,谷歌 AI 團隊發佈了 MLE-STAR(機器學習工程通過搜索和針對性優化),這是一款先進的代理系統,旨在自動化複雜的機器學習流程設計與優化。MLE-STAR 結合了大規模網絡搜索、針對性代碼優化和強大的檢查模塊,在多個機器學習工程任務上表現出色,超越了以往的自主機器學習代理和人類基線方法。

image.png

當前,儘管大型語言模型(LLMs)在代碼生成和工作流自動化方面取得了一定進展,但現有的機器學習工程代理仍然面臨諸多挑戰。比如,過於依賴 LLM 的記憶,往往只使用 “熟悉” 的模型,忽視了先進的、任務特定的方法;又如,之前的代理修改代碼時往往採取 “一次性全改” 的方式,缺乏對數據預處理、特徵工程等管道組件的深入探索。此外,生成的代碼也容易出現錯誤、數據泄露等問題。

image.png

MLE-STAR 針對這些問題,推出了一系列核心創新。首先,MLE-STAR 通過網絡搜索來選擇模型和代碼片段,而不僅僅依賴其內部的 “記憶”,確保初始解決方案基於當前最佳實踐。其次,它採用了兩輪優化過程:外部循環通過消融研究識別影響性能的關鍵組件,而內部循環則針對這些組件進行深入探索。此外,MLE-STAR 還能夠提出並實施新穎的集成方法,通過多種候選解決方案的結合,提升整體性能。

image.png

爲了確保代碼的質量,MLE-STAR 還引入了多個專門的代理,包括自動捕捉和修復 Python 錯誤的調試代理、檢查數據泄露的代理以及確保充分利用所有數據文件的使用檢查代理。通過這些措施,MLE-STAR 在各種基準測試中表現卓越,尤其是在 Kaggle 競賽中,獲得了顯著的金牌和優秀作品率。

MLE-STAR 的開源代碼庫也使研究人員和機器學習從業者能夠將這些先進的能力整合到自己的項目中,從而加速生產力和創新的進程。

項目:https://github.com/nv-tlabs/cosmos1-diffusion-renderer

劃重點:  

💡 MLE-STAR 是谷歌推出的先進機器學習工程代理,旨在自動化複雜任務。  

🔍 採用網絡搜索、針對性優化和多種檢查機制,MLE-STAR 顯著提升了機器學習工程的效率和質量。  

🏆 在 Kaggle 競賽中,MLE-STAR 表現優異,取得了更高的金牌和優秀作品率。