中国ビジュアル大モデルの競争新展開：ドウバオが首位を獲得、国内実力が全面的な逆転を遂げた！

SuperCLUE-VLMは最新の中国語マルチモーダルビジョン言語モデル評価結果を発表し、国内人工知能分野における大きな飛躍を示しています。今回の評価では、ビットテクノロジーのDoubao-Seed-2.0-Pro-260215が90.66点という優れた成績で総合ランキング1位を獲得し、グーグルのGemini-3.1-Pro-Preview（89.35点）を上回りました。

今回の評価には国内外の17種類の主要なビジュアル言語モデルが含まれており、国内モデルは優れた成績を収め、ランクインの上位に多数進出しました。アリババのQwen3.5シリーズやセンスノヴァ、智譜GLMなども良好な成績を収めています。一方で、OpenAIのGPT-5.4や他の海外有名モデルは中流以下の順位にとどまっており、国内モデルの強い上昇傾向が示されています。

評価内容は3つの主要な次元に分けられ、基礎認知、視覚的推論、視覚的応用の3つで構成され、25項目の具体的なタスクをカバーしており、一般的な認識や医療画像などが含まれます。評価結果によると、国内モデルは基礎認知とデータ分析において特に突出しており、得点は一般的に90点以上で、成熟した安定した能力を示しています。しかし、視覚的推論や産業・医療などの専門的な応用分野ではさらなる向上が必要であり、一部の専門的なシナリオでは得点が比較的低いです。

重要なポイント：
🌟 Doubao-Seed-2.0-Pro-260215は90.66点で第1位となり、グーグルのGemini-3.1-Pro-Previewを上回りました。
📊 国内モデルは基礎認知およびデータ分析において得点が一般的に90点を超え、安定した成績を収めています。
🛠️ 視覚的推論および専門的な応用分野では国内モデルはさらに改善が必要であり、一部のシナリオでの得点が低いです。

マルチモーダル大モデルの最新評価が公開！Gemini-3-Proが断然一位、ドウピッコ、ショートゴーが国内勢をリード Qwen3-VLが初めてオープンソースで高得点を記録

SuperCLUE-VLMの最新ランキングによると、グーグルのGemini-3-Proは83.64点で大幅にリードし、視覚的理解と推論において明確な優位性を示しています。国内モデルも突出しており、ショートゴーのSenseNova V6.5Proとバイチュウトゥンドウピッコが2位と3位となり、中国のAIがマルチモーダル分野で急速な進歩を遂げていることを示しています。この評価は3つの主要な能力次元をカバーしています。

チンテンズーが数億元のPre-Aラウンド資金調達を獲得し、身体的知能ロボット履行ネットワークの建設を加速

擎天租が数億元のPre-Aラウンド資金調達を完了。正大ロボット、長信股份、美格智能、藍思科技などの産業資本や上場企業が参加し、既存株主も追加投資。資金は全国のサービス拠点整備、ロボット配車システムのアップグレード、グローバルネットワーク拡大に活用。現在、プラットフォームで配車可能なロボットは4000台超。....

アント・テクノロジーがLingDT-2.6-flashをリリースし、企業向けの実用的なAIツールをさらに提供

大規模モデルの競争焦点は性能の比較から企業シナリオにおけるスケーラブルな応用へと移り、コストパフォーマンスと効率が重要視されている。アント・テクノロジーはLing-2.6-flashビジネス版であるLingDT-2.6-flashをリリースし、メインとなるのは「Token効率」で、同パラメータレベルのモデルと比較して90%のToken消費量を節約でき、より速く、より低コストで、企業の現実的なシナリオに適した大規模な展開が可能になる。

中国ビジュアル大モデルの競争新展開：ドウバオが首位を獲得、国内実力が全面的な逆転を遂げた！

関連推奨

マルチモーダル大モデルの最新評価が公開！Gemini-3-Proが断然一位、ドウピッコ、ショートゴーが国内勢をリード Qwen3-VLが初めてオープンソースで高得点を記録

マルチモーダル視覚大モデル12月の戦報：Geminiが首位を独占、DoupoおよびSensetimeが国内勢をリード

SuperCLUEマルチモーダル視覚8月評価ランキング：Gemini-2.5-Proが1位を獲得

チンテンズーが数億元のPre-Aラウンド資金調達を獲得し、身体的知能ロボット履行ネットワークの建設を加速

アント・テクノロジーがLingDT-2.6-flashをリリースし、企業向けの実用的なAIツールをさらに提供