近日,谷歌 AI 团队发布了 MLE-STAR(机器学习工程通过搜索和针对性优化),这是一款先进的代理系统,旨在自动化复杂的机器学习流程设计与优化。MLE-STAR 结合了大规模网络搜索、针对性代码优化和强大的检查模块,在多个机器学习工程任务上表现出色,超越了以往的自主机器学习代理和人类基线方法。

image.png

当前,尽管大型语言模型(LLMs)在代码生成和工作流自动化方面取得了一定进展,但现有的机器学习工程代理仍然面临诸多挑战。比如,过于依赖 LLM 的记忆,往往只使用 “熟悉” 的模型,忽视了先进的、任务特定的方法;又如,之前的代理修改代码时往往采取 “一次性全改” 的方式,缺乏对数据预处理、特征工程等管道组件的深入探索。此外,生成的代码也容易出现错误、数据泄露等问题。

image.png

MLE-STAR 针对这些问题,推出了一系列核心创新。首先,MLE-STAR 通过网络搜索来选择模型和代码片段,而不仅仅依赖其内部的 “记忆”,确保初始解决方案基于当前最佳实践。其次,它采用了两轮优化过程:外部循环通过消融研究识别影响性能的关键组件,而内部循环则针对这些组件进行深入探索。此外,MLE-STAR 还能够提出并实施新颖的集成方法,通过多种候选解决方案的结合,提升整体性能。

image.png

为了确保代码的质量,MLE-STAR 还引入了多个专门的代理,包括自动捕捉和修复 Python 错误的调试代理、检查数据泄露的代理以及确保充分利用所有数据文件的使用检查代理。通过这些措施,MLE-STAR 在各种基准测试中表现卓越,尤其是在 Kaggle 竞赛中,获得了显著的金牌和优秀作品率。

MLE-STAR 的开源代码库也使研究人员和机器学习从业者能够将这些先进的能力整合到自己的项目中,从而加速生产力和创新的进程。

项目:https://github.com/nv-tlabs/cosmos1-diffusion-renderer

划重点:  

💡 MLE-STAR 是谷歌推出的先进机器学习工程代理,旨在自动化复杂任务。  

🔍 采用网络搜索、针对性优化和多种检查机制,MLE-STAR 显著提升了机器学习工程的效率和质量。  

🏆 在 Kaggle 竞赛中,MLE-STAR 表现优异,取得了更高的金牌和优秀作品率。