最近、グーグルAIチームはMLE-STAR(機械学習エンジニアリングのための検索と特化型最適化)をリリースしました。これは複雑な機械学習プロセスの設計と最適化を自動化するための先進的なエージェントシステムです。MLE-STARは大規模なネットワーク検索、特化型コード最適化、強力なチェックモジュールを組み合わせており、さまざまな機械学習エンジニアリングタスクにおいて、従来の自律的な機械学習エージェントや人間ベースライン手法を上回る性能を示しています。

image.png

現在、大型言語モデル(LLMs)はコード生成やワークフローの自動化において一定の進展を遂げていますが、現存する機械学習エンジニアリングエージェントには多くの課題があります。例えば、LLMの記憶に過度に依存し、単に「慣れ親しんだ」モデルを使用して、タスクに特化した高度な方法を無視してしまうことがあります。また、以前のエージェントはコードを変更する際に「一度にすべてを変更」する方式を採用しており、データ前処理や特徴工学などのパイプラインコンポーネントについての深い探求が不足しています。さらに、生成されたコードにはエラーが生じたり、データ漏洩が発生したりする問題もあります。

image.png

MLE-STARはこれらの課題に対応するために、一連の核心的な革新を導入しました。まず、MLE-STARは内部の「記憶」に頼らず、ネットワーク検索を通じてモデルとコードスニペットを選択し、初期ソリューションが現在のベストプラクティスに基づいていることを確保します。次に、外部ループではアブレーション研究を通じてパフォーマンスに影響を与える重要なコンポーネントを特定し、内部ループではこれらのコンポーネントに対して深く掘り下げた探索を行います。さらに、MLE-STARは新規な統合方法を提案し、実装することができ、複数の候補ソリューションを組み合わせることで全体のパフォーマンスを向上させます。

image.png

コードの品質を確保するため、MLE-STARは複数の専門的なエージェントも導入しています。それは、Pythonのエラーを自動的にキャプチャ・修復するデバッグエージェント、データ漏洩をチェックするエージェント、すべてのデータファイルを適切に利用しているかを確認する使用チェックエージェントなどです。これらの対策により、MLE-STARはさまざまなベンチマークテストで優れた結果を示し、特にKaggleコンペティションでは、より高い金メダル獲得率と優秀な作品率を達成しています。

MLE-STARのオープンソースコードライブラリにより、研究者や機械学習の専門家はこれらの高度な能力を自らのプロジェクトに統合することが可能となり、生産性とイノベーションのプロセスを加速させることができます。

プロジェクト:https://github.com/nv-tlabs/cosmos1-diffusion-renderer

ポイント:  

💡 MLE-STARはグーグルが開発した高度な機械学習エンジニアリングエージェントであり、複雑なタスクを自動化することを目的としています。

🔍 検索、特化型最適化、そして多様なチェックメカニズムを採用することで、MLE-STARは機械学習エンジニアリングの効率と質を大幅に向上させました。

🏆 Kaggleコンペティションにおいて、MLE-STARは優れた成績を収め、より高い金メダル獲得率と優秀な作品率を達成しました。