グーグルAI研究チームは最近、DS STAR(データサイエンスエージェントによるイテレーション計画と検証)というマルチエージェントフレームワークをリリースしました。これは、人間のアナリストの介入なしに、曖昧なビジネス問題を実行可能なPythonコードに変換するためのものです。従来のデータサイエンスエージェントが構造化されたSQLデータベースに依存しているのとは異なり、DS STARはCSV、JSON、Markdown、非構造化テキストなどの混合形式のデータファイルを直接処理できます。

image.png

DS STARの作業フローはいくつかの段階に分かれています。まず、システムはAanalyzerというエージェントによってデータレイク内の各ファイルを分析し、列名、データタイプ、メタデータなどの重要な情報を抽出するためのPythonスクリプトを生成します。このステップにより、システムは各ファイルの構造化ビューを取得し、後の分析に文脈情報を提供します。

データ分析が完了した後、DS STARはイテレーション計画と検証のループに入ります。このプロセスにはAplanner、Acoder、Averifier、Arouterなどの複数のエージェントが含まれます。Aplannerは初期の実行可能なステップを作成し、AcoderはこれらのステップをPythonコードに変換します。実行後、観測結果が得られます。Averifierは実行結果に基づいて現在の計画の十分性を評価し、必要に応じてArouterが計画を修正する方法を決定します。このループは、望ましい結果を得るか、最大イテレーション回数に達するまで継続されます。

また、DS STARはAdebuggerとRetrieverモジュールを備え、システムの耐障害性を高めています。Adebuggerはスクリプトが失敗したときに修復を行い、パターンのずれや欠損列があってもシステムが正常に動作し続けることを保証します。一方、Retrieverは膨大なデータセットから最も関連性のあるファイルを検索し、分析中に文脈サポートを提供します。

一連のベンチマークテストでは、DS STARはDABStep、KramaBench、DA Codeなどの複数のタスクで優れたパフォーマンスを発揮し、分析の正確性を大幅に向上させました。これにより、DS STARが複雑なデータサイエンス問題を信頼できるPythonソリューションに効果的に変換できること、そしてデータ分析の自動化プロセスを推進できることを示しています。

論文:https://arxiv.org/pdf/2509.21825

ポイント:  

🌟 DS STARは、曖昧なビジネス問題を実行可能なPythonコードに変換するマルチエージェントフレームワークです。  

📊 このシステムは、複数のエージェントの協力により、データ分析、コード生成、結果検証のイテレーションプロセスを完了します。  

🚀 ベンチマークテストでは、DS STARはデータサイエンスタスクの分析精度を大幅に向上させ、強力な自動化能力を示しています。