SuperCLUE-VLM 發佈了最新的中文多模態視覺語言模型測評結果,標誌着國內人工智能領域的一次重大突破。在此次評測中,字節跳動的 Doubao-Seed-2.0-Pro-260215 以 90.66 分的優異成績榮獲總榜第一,成功超越了谷歌的 Gemini-3.1-Pro-Preview,後者得分爲 89.35 分。

image.png

本次測評涵蓋了國內外 17 款主流視覺語言模型,國產模型表現出色,不僅在榜單中佔據多個前列名次,阿里巴巴的 Qwen3.5 系列、商湯的 SenseNova、以及智譜 GLM 等均表現不俗。相比之下,OpenAI 的 GPT-5.4 和其他一些海外知名模型則只能排在中游位置,顯示出國產模型的強勁上升勢頭。

評測的內容涉及三個主要維度:基礎認知、視覺推理和視覺應用,涵蓋了多達 25 項具體任務,包括通用識別和醫療影像等。評測結果顯示,國產模型在基礎認知和數據分析上表現尤爲突出,得分普遍超過 90 分,展現了成熟而穩定的能力。然而,在視覺推理及工業、醫療等專業應用領域,國內模型仍然有待進一步提升,某些專業場景的得分相對較低。

劃重點:  

🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分獲評第一,超越谷歌 Gemini-3.1-Pro-Preview。  

📊 國產模型在基礎認知和數據分析上得分普遍超過 90 分,表現穩定。  

🛠️ 在視覺推理及專業應用領域,國產模型仍需提升,部分場景得分偏低。