大注目！学術チームがSFTを活用して大手企業の支配を打ち破り、OpenSeeker-v2が検索スマートエージェントランキングで1位に

現在の大規模言語モデル（LLM）分野において、深層的な検索能力はトップクラスのスマートエージェントにとって「必殺技」となっています。しかし、この分野のルールは長年、資金力のある産業の大手企業によって主導されてきました。従来の開発方法は、予訓練、継続的予訓練（CPT）、監督微調整（SFT）、強化学習（RL）といった非常にリソースを消費するプロセスに依存していました。

最近、学術界の研究チームが最新の成果であるOpenSeeker-v2を公開し、この常識を完全に打ち破りました。研究報告によると、高品質で難易度の高いタスクのトレースを使用してトレーニングを行うことで、単純な監督微調整（SFT）の方法でも高性能な検索エージェントを構築することが可能であることが示されています。

このチームはデータ合成に関して3つの主要な最適化戦略を提案しました。第一に、知識グラフの規模を拡大してより豊かな探索空間を提供すること。第二に、ツールキットの数を大幅に増やし、機能の境界を広げること。第三に、厳格な低ステップフィルタリングを実施し、トレーニングデータの精練と効率性を確保することです。

実験データによると、1.06万個のデータポイントのみでトレーニングされたOpenSeeker-v2（30B規模、ReActアーキテクチャ）は、4つの主要なベンチマークテストで極めて強力なパフォーマンスを示しました。その正確率はBrowseCompで46.0%、BrowseComp-ZHでは58.1%、『人類最後の試験』（Humanity's Last Exam）では34.6%、xbenchでは78.0%に達しました。これらの成績は記録を更新しただけでなく、産業界モデルである通義DeepResearchが採用する重いCPT+SFT+RLの複雑なパイプラインでトレーニングされたモデルを全面的に上回りました。

注目すべきは、これは同等のモデル規模とアーキテクチャで、純粋な学術チームがSFT技術だけで実現した初のSOTA（state-of-the-art）検索エージェントであるということです。現在、このチームはOpenSeeker-v2のモデルウェイトを正式にオープンソース化しています。この発見により、最先端の検索エージェントの開発の障壁が大きく低下し、学術界とオープンソースコミュニティに参考価値の高い軽量な開発経路を提供しています。

論文のURL：https://arxiv.org/pdf/2605.04036

ステップスターが初のAIエージェント携帯電話を発表予定 OpenAIよりも前に走る

階躍星辰が新世代AIエージェント端末発表、AI端末ブランド・エージェントシステム・初のAIエージェントスマホを公開。OpenAIより早く世界初のネイティブエージェントスマホを実現。華勤技術がODM生産を担当、両社は深い提携関係を構築。....

ステップスターが世界のAIエージェントスマホを発売

阶跃星辰、AI端末新ブランド・エージェントシステム・初のAIエージェントスマホを発表へ。大規模モデルメーカーで初のエージェントハード実装。端末AI浸透で戦略的要衝に、OpenAIも2027年投入予定の中、阶跃星辰が先行。....

コードリファクタリングの不安を告別：アリババがPage Agentを開発し、大規模モデルがウェブページの基本的な論理を理解できるように

アリババがPage Agentをオープンソース化し、ブラウザ自動化の考え方が変わりました。これは大規模モデルがウェブページ構造を直接解析するもので、外部のスクリーンショットやプロトコル駆動に頼らず、変化にダイナミックに対応し、「新しいホイールを造る」課題を解決します。

メイドゥーの大規模モデルエコシステムの調整：ダオバオの全面的な使用制限、自社開発のLongCatシステムの推進

メイドゥーは内部で字節傘下のダオバオの大規模モデルの使用を制限し、業務チームが呼び出し状況を自主的に確認するよう求めた。保持が必要な場合は、必要性の説明および移行計画を提出する必要がある。この動きは、メイドゥーが自社開発のAIソリューションへの傾斜を加速させていることを示しており、インフラストラクチャの選択が調整されている。

大注目！学術チームがSFTを活用して大手企業の支配を打ち破り、OpenSeeker-v2が検索スマートエージェントランキングで1位に

関連推奨

ステップスターが初のAIエージェント携帯電話を発表予定 OpenAIよりも前に走る

ステップスターが世界のAIエージェントスマホを発売

Claude エリートモデル Fable 5 が按需課金モードを開始、サブスクリプションユーザーの権利は制限される

コードリファクタリングの不安を告別：アリババがPage Agentを開発し、大規模モデルがウェブページの基本的な論理を理解できるように

メイドゥーの大規模モデルエコシステムの調整：ダオバオの全面的な使用制限、自社開発のLongCatシステムの推進