最近、ステップスターリーは新たに深層研究モデル「Step-DeepResearch」を正式にオープンソース化しました。このモデルは320億パラメータを持ち、オープンな研究環境において自律的な情報探索と専門的なレポート作成を目的としています。公式の説明によると、Step-DeepResearchは深層研究能力においてOpenAIのo3-miniやGemini2.0Flashなどのトップクラスの商用モデルに近づいており、その導入コストは従来モデルの10分の1にとどまっています。一度の呼び出しコストは0.5元人民元未満です。

image.png

Step-DeepResearchの設計理念は非常に独自です。複雑な研究タスクを訓練可能な「原子的機能」として分解し、計画、情報検索、反省、相互検証などを行います。これにより、閉ループによる反省と動的な校正が可能になります。この方法により、モデルは複雑な環境における自己調整能力を向上させ、汎用性も強化されました。トレーニングプロセスは丁寧に設計されており、エージェントの中間トレーニングから監督付き微調整(SFT)および強化学習(RL)まで、複雑な実際の応用で優れた性能を発揮します。

テストでは、Step-DeepResearchはScale AI Research Rubricsで61.4%という高いスコアを取得し、OpenAI Deep ResearchやGemini Deep Researchなどのより大規模なモデルと同等の結果を示しています。また、ADR-Benchでの専門家評価では、Step-DeepResearchのEloスコアは多くの競合企業を大きく上回り、深層研究分野における強力な能力を示しています。

科研作業の流れをサポートするために、Step-DeepResearchはReActパターンに基づいた単一エージェントアーキテクチャを使用しており、推論、行動、反省の動的なサイクルを備えています。内部の独自ツールキットを通じて、このシステムは効率的に一括ウェブ検索、ファイル管理、インタラクティブコマンド実行などのタスクを処理でき、研究者にとって大きな利便性を提供します。

github:https://github.com/stepfun-ai/StepDeepResearch

注目ポイント:  

✨ Step-DeepResearchは、ステップスターリーが最新にオープンソース化した深層研究モデルで、パラメータ数は320億です。

💡 このモデルは深層研究能力においてトップレベルの商用モデルと同様ですが、コストは従来モデルの10分の1です。

🚀 独特なトレーニングプロセスと動的なループアーキテクチャにより、Step-DeepResearchは科研作業において効率的な支援を提供します。