現在の大規模言語モデル(LLM)分野において、深層的な検索能力はトップクラスのスマートエージェントにとって「必殺技」となっています。しかし、この分野のルールは長年、資金力のある産業の大手企業によって主導されてきました。従来の開発方法は、予訓練、継続的予訓練(CPT)、監督微調整(SFT)、強化学習(RL)といった非常にリソースを消費するプロセスに依存していました。

最近、学術界の研究チームが最新の成果であるOpenSeeker-v2を公開し、この常識を完全に打ち破りました。研究報告によると、高品質で難易度の高いタスクのトレースを使用してトレーニングを行うことで、単純な監督微調整(SFT)の方法でも高性能な検索エージェントを構築することが可能であることが示されています。

image.png

このチームはデータ合成に関して3つの主要な最適化戦略を提案しました。第一に、知識グラフの規模を拡大してより豊かな探索空間を提供すること。第二に、ツールキットの数を大幅に増やし、機能の境界を広げること。第三に、厳格な低ステップフィルタリングを実施し、トレーニングデータの精練と効率性を確保することです。

実験データによると、1.06万個のデータポイントのみでトレーニングされたOpenSeeker-v2(30B規模、ReActアーキテクチャ)は、4つの主要なベンチマークテストで極めて強力なパフォーマンスを示しました。その正確率はBrowseCompで46.0%、BrowseComp-ZHでは58.1%、『人類最後の試験』(Humanity's Last Exam)では34.6%、xbenchでは78.0%に達しました。これらの成績は記録を更新しただけでなく、産業界モデルである通義DeepResearchが採用する重いCPT+SFT+RLの複雑なパイプラインでトレーニングされたモデルを全面的に上回りました。

image.png

注目すべきは、これは同等のモデル規模とアーキテクチャで、純粋な学術チームがSFT技術だけで実現した初のSOTA(state-of-the-art)検索エージェントであるということです。現在、このチームはOpenSeeker-v2のモデルウェイトを正式にオープンソース化しています。この発見により、最先端の検索エージェントの開発の障壁が大きく低下し、学術界とオープンソースコミュニティに参考価値の高い軽量な開発経路を提供しています。

論文のURL:https://arxiv.org/pdf/2605.04036