中國大模型正在從“追隨者”向“並跑者”甚至“領跑者”角色加速轉變。

3月30日,中文大模型基準測評SuperCLUE發佈了2026年3月最新結果。本次測評共有22款國內外主流模型參評,涵蓋了數學推理、科學推理、代碼生成等六大核心任務。結果顯示,以“豆包”爲代表的國產模型已成功殺入全球頂尖陣營。

image.png

全球視野:海外閉源模型仍守高地,豆包緊隨其後

在本次測評的總分榜單上,海外閉源模型依然展現了深厚的技術底蘊:

前三強: Anthropic 的Claude-Opus-4.6、Google 的Gemini-3.1-Pro以及 OpenAI 的GPT-5.4分列全球前三。

國產之光: 字節跳動旗下的豆包(Doubao-Seed-2.0-pro)以71.53分奪得國內第一,不僅穩居全球第一梯隊,與 GPT-5.4的分差已縮小至0.95分。

智能體突破: 在智能體任務規劃維度,豆包更是反超部分海外模型,躋身全球前五。

小米表現:MiMo-V2系列數學推理能力亮眼

作爲手機大廠跨界 AI 的代表,小米集團的 MiMo 系列在本次測評中表現穩健:

數學尖子生: MiMo-V2-Pro以60.67分位列閉源模型前列,其在數學推理任務中拿下了 84.03分 的高分。

雙模上榜: 除 Pro 版本外,開源版本的MiMo-V2-Flash也同步上榜,在代碼生成等細分場景中展現出不俗的進化潛力。

開源賽道:國產模型實現“包攬式”領先

相比閉源領域的激戰,國產模型在開源賽道展現出了統治級優勢:

包攬前三: Kimi-K2.5-ThinkingQwen3.5-397B等國產開源模型包攬了開源榜單的前三名。

降維打擊: 測評數據顯示,國產開源模型在整體表現上已大幅領先海外同類開源產品,成爲全球開發者的新寵。

結語:從“參數競賽”走向“能力實戰”

從2026年3月的這份這份榜單可以看出,中文大模型已不再滿足於簡單的中文語境理解,而是在邏輯推理、代碼生成等硬核領域與全球頂級模型展開正面硬剛。隨着豆包的身位前移與小米 MiMo在細分領域的深耕,國產大模型正迎來真正意義上的“實戰爆發期”。