中国の大規模モデルは、「追従者」から「並行者」、あるいは「リーダー」としての役割に急速に転換しています。

3月30日、中国語の大規模モデルの基準評価SuperCLUEが2026年3月の最新結果を発表しました。今回の評価には、国内外の主流モデルが22種類参加し、数学的推論、科学的推論、コード生成などの6つの主要なタスクが含まれています。その結果、例えば「豆包(ドゥーパオ)」のような国内モデルが世界トップクラスの陣営に参入したことが明らかになりました。

image.png

グローバル視点:海外の非オープンモデルは依然として優位を維持、豆包はその後を追う

今回の総合スコアランキングにおいて、海外の非オープンモデルは依然として深い技術力を見せています:

上位3社: Anthropic のClaude-Opus-4.6、Google のGemini-3.1-Pro、OpenAI のGPT-5.4が世界でトップ3を占めています。

国内の光: ツイッター傘下の豆包(Doubao-Seed-2.0-pro)は71.53点で国内第1位となり、世界の第1グループに安定して位置づけられ、GPT-5.4との差はわずか0.95点に縮まっています。

スマートエージェントの突破: スマートエージェントのタスク計画の観点から見ると、豆包は一部の海外モデルを上回り、世界の上位5位にランクインしました。

小米の表現:MiMo-V2シリーズの数学的推論能力が目覚ましい

スマホ大手企業がAIに進出する代表として、小米グループのMiMoシリーズは今回の評価で安定した成績を収めました:

数学の秀才:MiMo-V2-Proは閉鎖型モデルの中で60.67点を獲得し、数学的推論のタスクでは84.03点

二つ以上のモデルが登場: また、Pro版だけでなく、オープンソース版のMiMo-V2-Flashも同時にランキングに登場し、コード生成などの細分化されたシナリオにおいて、進化の可能性を示しています。

オープンソースの競争:国内モデルが「完結型」の優位を獲得

閉鎖型モデルの激戦とは対照的に、国内モデルはオープンソースの分野で支配的な優位性を示しています:

上位3社を独占:Kimi-K2.5-ThinkingQwen3.5-397Bなどの国内オープンソースモデルが、オープンソースのランキングで上位3位を独占しました。

圧倒的な優位: 評価データによると、国内オープンソースモデルは全体的に海外の同様のオープンソース製品を大幅に上回り、世界中の開発者の新しいお気に入りとなっています。

結論:パラメータの競争から「実力の実証」へ

2026年3月のこのランキングを見れば、中国語の大規模モデルは単なる中国語の文脈理解に満足せず、論理的推論やコード生成などの本格的な分野で世界のトップモデルと正面衝突していることがわかります。豆包の順位の上昇と小米 MiMo