SuperCLUE-VLMは最新の中国語マルチモーダルビジョン言語モデル評価結果を発表し、国内人工知能分野における大きな飛躍を示しています。今回の評価では、ビットテクノロジーのDoubao-Seed-2.0-Pro-260215が90.66点という優れた成績で総合ランキング1位を獲得し、グーグルのGemini-3.1-Pro-Preview(89.35点)を上回りました。

今回の評価には国内外の17種類の主要なビジュアル言語モデルが含まれており、国内モデルは優れた成績を収め、ランクインの上位に多数進出しました。アリババのQwen3.5シリーズやセンスノヴァ、智譜GLMなども良好な成績を収めています。一方で、OpenAIのGPT-5.4や他の海外有名モデルは中流以下の順位にとどまっており、国内モデルの強い上昇傾向が示されています。
評価内容は3つの主要な次元に分けられ、基礎認知、視覚的推論、視覚的応用の3つで構成され、25項目の具体的なタスクをカバーしており、一般的な認識や医療画像などが含まれます。評価結果によると、国内モデルは基礎認知とデータ分析において特に突出しており、得点は一般的に90点以上で、成熟した安定した能力を示しています。しかし、視覚的推論や産業・医療などの専門的な応用分野ではさらなる向上が必要であり、一部の専門的なシナリオでは得点が比較的低いです。
重要なポイント:
🌟 Doubao-Seed-2.0-Pro-260215は90.66点で第1位となり、グーグルのGemini-3.1-Pro-Previewを上回りました。
📊 国内モデルは基礎認知およびデータ分析において得点が一般的に90点を超え、安定した成績を収めています。
🛠️ 視覚的推論および専門的な応用分野では国内モデルはさらに改善が必要であり、一部のシナリオでの得点が低いです。
