国産モデルが爆発！ドウバオが世界第1グループにランクイン、小米MiMoの数学推論が高得点

中国の大規模モデルは、「追従者」から「並行者」、あるいは「リーダー」としての役割に急速に転換しています。

3月30日、中国語の大規模モデルの基準評価SuperCLUEが2026年3月の最新結果を発表しました。今回の評価には、国内外の主流モデルが22種類参加し、数学的推論、科学的推論、コード生成などの6つの主要なタスクが含まれています。その結果、例えば「豆包（ドゥーパオ）」のような国内モデルが世界トップクラスの陣営に参入したことが明らかになりました。

グローバル視点：海外の非オープンモデルは依然として優位を維持、豆包はその後を追う

今回の総合スコアランキングにおいて、海外の非オープンモデルは依然として深い技術力を見せています:

上位3社： Anthropic のClaude-Opus-4.6、Google のGemini-3.1-Pro、OpenAI のGPT-5.4が世界でトップ3を占めています。

国内の光： ツイッター傘下の豆包（Doubao-Seed-2.0-pro）は71.53点で国内第1位となり、世界の第1グループに安定して位置づけられ、GPT-5.4との差はわずか0.95点に縮まっています。

スマートエージェントの突破： スマートエージェントのタスク計画の観点から見ると、豆包は一部の海外モデルを上回り、世界の上位5位にランクインしました。

小米の表現：MiMo-V2シリーズの数学的推論能力が目覚ましい

スマホ大手企業がAIに進出する代表として、小米グループのMiMoシリーズは今回の評価で安定した成績を収めました:

数学の秀才：MiMo-V2-Proは閉鎖型モデルの中で60.67点を獲得し、数学的推論のタスクでは84.03点

二つ以上のモデルが登場： また、Pro版だけでなく、オープンソース版のMiMo-V2-Flashも同時にランキングに登場し、コード生成などの細分化されたシナリオにおいて、進化の可能性を示しています。

オープンソースの競争：国内モデルが「完結型」の優位を獲得

閉鎖型モデルの激戦とは対照的に、国内モデルはオープンソースの分野で支配的な優位性を示しています：

上位3社を独占：Kimi-K2.5-ThinkingとQwen3.5-397Bなどの国内オープンソースモデルが、オープンソースのランキングで上位3位を独占しました。

圧倒的な優位： 評価データによると、国内オープンソースモデルは全体的に海外の同様のオープンソース製品を大幅に上回り、世界中の開発者の新しいお気に入りとなっています。

結論：パラメータの競争から「実力の実証」へ

2026年3月のこのランキングを見れば、中国語の大規模モデルは単なる中国語の文脈理解に満足せず、論理的推論やコード生成などの本格的な分野で世界のトップモデルと正面衝突していることがわかります。豆包の順位の上昇と小米 MiMo

速度が4倍に！グーグルが深夜に最強モデル「Gemini 3.5 Flash」を発表

グーグルはI/O 2026カンファレンスで新たに登場した大規模モデル「Gemini 3.5 Flash」を発表し、AIのスピード記録を更新しました。このモデルは最高級の知能とプログラミング能力を持ち、エリートモデルと同等の性能を備えており、同時にFlashシリーズの高速応答の利点を保持しています。現在、世界中のユーザーに無料で公開されており、利用のハードルをさらに下げ、業界の変革を推進しています。

千マイルドルのシードラウンドが完了。記憶大モデルMemoraX AIはAIの記憶喪失症を解決できるのか？

ハウ・ジアントゥェイは、AIがストレージから「記憶」へと進化しなければ、真の知的パートナーとは言えないと考えている。彼が設立した憶紀元テクノロジー（MemoraX AI）は設立後わずか1か月で千マイルドルのシードラウンド資金調達に成功し、L2F光源創業者ファンドとジンディングキャピタルが共同リードとして関与した。この資金は主にAgentic RL（エージェント強化学習）技術の研究開発に使われる予定で、大モデルが単なる効率的な検索エンジンにとどまらないようにするためのものである。

アントグループが第9回デジタル中国建設フォーラムに登場、Data+AI応用成果が初めて一斉展示

アントグループは第9回デジタル中国建設フォーラムにおいて「Data+AI」をコアとし、下部技術から産業応用までのフルスタックの構築を初めて披露しました。これはデータ戦略が「知能信頼可能な転送」の新段階へとアップグレードしたことを示しています。大モデルを生活シーンに組み込み、AIツールの実用化を実現しており、「医療AIアプリケーションアントアフー（アモア）」は1億人以上のユーザーにサービスを提供し、福州市衛生健康委員会と協力関係を築いています。

DeepSeek V4 中文大モデル評価：国内最高峰を再び達成！

DeepSeek V4の中国語大モデル評価において、Proバージョンは70.98点で再び国内一位に輝き、Flashバージョンは68.82点でその後を追った。評価内容は数学推論、科学推論、コード生成、エージェントタスク計画、指示遵守および幻覚制御の6つの次元をカバーし、国産オープンソースモデルの技術的突破を示している。

中国製GPUの新進展：モアーラインS5000が中国移動の「九天」大モデルを支援