國內權威的大模型測評基準 SuperCLUE 發佈了最新的綜合性報告。測評結果顯示,字節跳動旗下的 豆包(Doubao-pro) 表現強勁,成功躋身全球大模型的第一梯隊,與國際頂級模型展開正面交鋒。

此外,小米祕密研發的 MiMo 大模型首次出現在榜單中,引發了行業對手機廠商自研大模型能力的關注。

image.png

國產模型集體進化:多維度能力對標 GPT-4

在本次測評中,國產大模型在中文語境理解、常識推理及邏輯演繹方面取得了顯著進步。豆包 不僅在基礎對話質量上表現優異,其在複雜任務規劃和長文本處理上的穩定性也獲得了高分評價。

緊隨其後的百度文心一言、阿里通義千問等模型依然穩居前列,顯示出頭部廠商在語料積累和對齊技術上的深厚積澱。

值得注意的是,小米 MiMo 的上榜意味着端側 AI 結合雲端大模型的路徑正在走通,爲未來的智能手機交互提供了更多想象空間。

差異化競爭:從通用智能向垂直場景滲透

測評報告指出,當前的中文大模型競爭已不再僅僅是參數量的堆砌,而是轉向了更精細化的場景競爭。

豆包憑藉字節系生態的流量優勢,在內容創作和社交互動場景中表現突出;而小米 MiMo 則在系統級調度和多設備協同方面展現了獨特優勢。

SuperCLUE 專家組認爲,隨着模型能力的均衡化,未來的勝負手將取決於誰能更有效地解決行業特定痛點,並提供更低延遲、更高性價比的算力服務。