國產模型爆發！豆包躋身全球第一梯隊，小米 MiMo 數學推理獲高分

中國大模型正在從“追隨者”向“並跑者”甚至“領跑者”角色加速轉變。

3月30日，中文大模型基準測評SuperCLUE發佈了2026年3月最新結果。本次測評共有22款國內外主流模型參評，涵蓋了數學推理、科學推理、代碼生成等六大核心任務。結果顯示，以“豆包”爲代表的國產模型已成功殺入全球頂尖陣營。

全球視野:海外閉源模型仍守高地，豆包緊隨其後

在本次測評的總分榜單上，海外閉源模型依然展現了深厚的技術底蘊:

前三強: Anthropic 的Claude-Opus-4.6、Google 的Gemini-3.1-Pro以及 OpenAI 的GPT-5.4分列全球前三。

國產之光: 字節跳動旗下的豆包（Doubao-Seed-2.0-pro）以71.53分奪得國內第一，不僅穩居全球第一梯隊，與 GPT-5.4的分差已縮小至0.95分。

智能體突破: 在智能體任務規劃維度，豆包更是反超部分海外模型，躋身全球前五。

小米表現:MiMo-V2系列數學推理能力亮眼

作爲手機大廠跨界 AI 的代表，小米集團的 MiMo 系列在本次測評中表現穩健:

數學尖子生: MiMo-V2-Pro以60.67分位列閉源模型前列，其在數學推理任務中拿下了 84.03分 的高分。

雙模上榜: 除 Pro 版本外，開源版本的MiMo-V2-Flash也同步上榜，在代碼生成等細分場景中展現出不俗的進化潛力。

開源賽道:國產模型實現“包攬式”領先

相比閉源領域的激戰，國產模型在開源賽道展現出了統治級優勢:

包攬前三: Kimi-K2.5-Thinking與Qwen3.5-397B等國產開源模型包攬了開源榜單的前三名。

降維打擊: 測評數據顯示，國產開源模型在整體表現上已大幅領先海外同類開源產品，成爲全球開發者的新寵。

結語:從“參數競賽”走向“能力實戰”

從2026年3月的這份這份榜單可以看出，中文大模型已不再滿足於簡單的中文語境理解，而是在邏輯推理、代碼生成等硬核領域與全球頂級模型展開正面硬剛。隨着豆包的身位前移與小米 MiMo在細分領域的深耕，國產大模型正迎來真正意義上的“實戰爆發期”。

階躍星辰將發佈全球大模型廠商首款AI智能體手機

階躍星辰將發佈全新AI終端品牌、智能體系統及首款AI智能體手機，成爲全球大模型廠商中率先實現智能體硬件落地的玩家。當前AI大模型加速向端側滲透，新一代AI終端已成戰略高地，OpenAI亦計劃2027年推出產品，階躍星辰此次搶跑佈局。

騰訊Hy3 編程評測出爐：參數只有對手五分之一，代碼能力卻與DeepSeek-V4-Pro打平

SuperCLUE公佈騰訊Hy3語言模型編程專項測評，與DeepSeek-V4-Pro等對比。Hy3爲MoE架構，總參數295B、激活僅21B，支持256K上下文，號稱混元最強。結果參數遠小卻表現意外出色，從四大維度評估兼顧性能與花銷，測評針對國內程序員日常寫代碼的真實場景。

階躍星辰首款AI智能體手機即將發佈，跑在OpenAI前面