火山エッジは正式にドウバオ大モデル2.0(Doubao-Seed-2.0)シリーズをリリースし、同時に企業や開発者向けのAPIサービスも提供しています。個人ユーザーはボルカノ・アーカー体験センターまたはドウバオアプリの「専門家」モードで体験できます。
このバージョンは大規模な生産環境のニーズに合わせてシステム的な最適化が行われており、効率的な推論、マルチモーダル理解、複雑な指示の実行などの能力により、現実世界の複雑なタスクに対応することが可能です。また、業界のトップモデルと比較して推論コストは約1桁低下しており、日次トークン使用量はリリース当初から500倍以上増加しています。

ドウバオ大モデル2.0には4種類の差別化されたモデルがあり、さまざまなシナリオにおける遅延やコストのニーズに対応しています。Pro版は旗艦モデルとして、複雑な深い推論やAgentなどの高難度タスクに特化しています。Lite版は1.8バージョンを全面的に上回り、能力が向上し、トークン消費が少なく、コストパフォーマンスが優れています。Mini版は速度とコストを最優先にし、1.6Pro版と同等の能力を持ちます。Code版は開発者向けに最適化されており、本格的なプログラミング環境に適しており、TRAEと併用することで効果がさらに向上します。
今回のアップデートではマルチモーダル理解能力が全面的に向上し、視覚理解分野で業界のトップレベルに達しました。Pro版は空間理解のMMSIBench、運動理解のMotionBench、動画理解のVideoMMEなどの評価でGemini3proを上回り、図表理解のCharXiv-RQ能力も大幅に向上しています。
ビデオシーンに対して、モデルは時間系列と運動感知の理解を強化し、TVBenchなどの主要評価でリードを取っています。EgoTempoベンチマークスコアは人間を超え、長時間動画評価では多くのトップモデルを上回り、リアルタイムのビデオストリーム分析や積極的な指導などインタラクティブな機能を実現でき、フィットネスやファッションなどのサポートシナリオに適しています。また、テニスの動きを正確に推論し、運動動作を認識して専門的な指導を提供することも可能です。
モデルのLLMとAgentの能力も大幅に強化され、長尾領域の知識を補完することで、より専門的なシナリオのタスクに適応しています。Pro版はSuperGPQAでGPT5.2を上回り、HealthBenchでは第1位を獲得し、科学分野での成績はGemini3ProやGPT5.2と同等です。HLE-textは54.2点で世界をリードし、IMO評価ではGemini3proを上回り、ツール呼び出しや指示遵守などの側面でのパフォーマンスが優れています。STEM基準において一部のシナリオでGemini3Proを上回っています。
同時に、モデルの指示遵守の一貫性と制御性が強化され、長距離多段階タスクに長けています。「資料を探す - 総合する - 結論を出す」の連続ワークフローを完了でき、ツールと組み合わせてデータ処理、コンテンツ作成から画像生成およびレイアウトの全プロセスのタスクを完了できます。このモデルに基づいて構築されたスマートカスタマーエージェントは、顧客との対話、問題の転送、後工程のフォローアップなどの全プロセスのサービスを実現できます。また、Code版モデルは主流のIDEツールを安定して呼び出すことができ、フロントエンドの能力が顕著に改善され、カスタムスキルをサポートし、TRAEと組み合わせることで開発効率を大幅に向上させます。わずか5ステップのプロンプトで「AI正月祭」のような複雑なWebアプリケーションを構築でき、関連する素材はオープンソースとなっています。
