SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果,标志着国内人工智能领域的一次重大突破。在此次评测中,字节跳动的 Doubao-Seed-2.0-Pro-260215 以 90.66 分的优异成绩荣获总榜第一,成功超越了谷歌的 Gemini-3.1-Pro-Preview,后者得分为 89.35 分。

image.png

本次测评涵盖了国内外 17 款主流视觉语言模型,国产模型表现出色,不仅在榜单中占据多个前列名次,阿里巴巴的 Qwen3.5 系列、商汤的 SenseNova、以及智谱 GLM 等均表现不俗。相比之下,OpenAI 的 GPT-5.4 和其他一些海外知名模型则只能排在中游位置,显示出国产模型的强劲上升势头。

评测的内容涉及三个主要维度:基础认知、视觉推理和视觉应用,涵盖了多达 25 项具体任务,包括通用识别和医疗影像等。评测结果显示,国产模型在基础认知和数据分析上表现尤为突出,得分普遍超过 90 分,展现了成熟而稳定的能力。然而,在视觉推理及工业、医疗等专业应用领域,国内模型仍然有待进一步提升,某些专业场景的得分相对较低。

划重点:  

🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分获评第一,超越谷歌 Gemini-3.1-Pro-Preview。  

📊 国产模型在基础认知和数据分析上得分普遍超过 90 分,表现稳定。  

🛠️ 在视觉推理及专业应用领域,国产模型仍需提升,部分场景得分偏低。