人工知能分野において、通義 DeepResearch チームが最新の研究成果を発表し、広範な注目を集めています。この画期的な進展は、AIが「会話ができる」段階から「研究ができる」段階へと飛躍したことを示しており、世界に向けてその優れた性能を開放的に示しています。通義 DeepResearch は複数の権威あるベンチマークテストで最上の成績を収め、全体的な能力は多くの国際的な有名モデルを上回っています。また、モデル、フレームワーク、およびソリューションはすべて完全にオープンソース化されており、深層学習の生産性を誰もが享受できるようにしています。

国際的なモデルに比べて高価で制限が多い中、通義 DeepResearch チームは完全にオープンな姿勢を取り、一連のツールとソリューションを提供しています。例えば Humanity's Last Exam、BrowseComp、GAIA などのテストプロジェクトにおいて、軽量型モデルである 30B-A3B が優れたパフォーマンスを発揮し、最上の水準に達しています。

image.png

注目すべき点は、チームが公式ウェブサイトや GitHub 上で詳細な DeepResearch Agent の構築方法論を共有していることです。これはデータ合成から強化学習までの全工程をカバーしています。推論面では、2つの大きな利点があります。基本的な ReAct モードは複雑なプロンプトなしでもモデルの潜在力を十分に引き出すことができ、深層モードは複雑な推論と計画能力におけるパフォーマンスをさらに向上させています。

image.png

通義 DeepResearch チームはデータ戦略においても顕著な貢献をしています。彼らは多段階のデータ戦略を採用し、高価な人間によるラベリングに頼らず、増分プリトレーニングおよび後トレーニングの方法を用いて高品質な訓練データを生成しています。また、モデルの推論モードは2種類に分けられます。一つはネイティブな ReAct モード、もう一つは複雑なタスクに使用される Heavy モードであり、非常に困難な研究タスクの解決に便利です。

image.png

強化学習の過程において、通義 DeepResearch チームはアルゴリズムの最適化と安定したインフラストラクチャを通じて、モデルのパフォーマンスを継続的に向上させています。特定の戦略を採用することで、学習プロセス中の信号が正確に一致することを確保し、最終的には効率的な学習効果を達成しました。

通義 DeepResearch のリリースは、AIの研究に新たな方向性を提示するだけでなく、グローバルなテクノロジーコミュニティへの積極的な応答であり、オープンコラボレーションの力強さを示しています。