中文视觉大模型竞争新局面：豆包夺魁，国产实力全面反超！

SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果，标志着国内人工智能领域的一次重大突破。在此次评测中，字节跳动的 Doubao-Seed-2.0-Pro-260215 以 90.66 分的优异成绩荣获总榜第一，成功超越了谷歌的 Gemini-3.1-Pro-Preview，后者得分为 89.35 分。

本次测评涵盖了国内外 17 款主流视觉语言模型，国产模型表现出色，不仅在榜单中占据多个前列名次，阿里巴巴的 Qwen3.5 系列、商汤的 SenseNova、以及智谱 GLM 等均表现不俗。相比之下，OpenAI 的 GPT-5.4 和其他一些海外知名模型则只能排在中游位置，显示出国产模型的强劲上升势头。

评测的内容涉及三个主要维度：基础认知、视觉推理和视觉应用，涵盖了多达 25 项具体任务，包括通用识别和医疗影像等。评测结果显示，国产模型在基础认知和数据分析上表现尤为突出，得分普遍超过 90 分，展现了成熟而稳定的能力。然而，在视觉推理及工业、医疗等专业应用领域，国内模型仍然有待进一步提升，某些专业场景的得分相对较低。

划重点：
🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分获评第一，超越谷歌 Gemini-3.1-Pro-Preview。
📊 国产模型在基础认知和数据分析上得分普遍超过 90 分，表现稳定。
🛠️ 在视觉推理及专业应用领域，国产模型仍需提升，部分场景得分偏低。

国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一

SuperCLUE-VLM 2026年4月评测报告显示，中文多模态视觉语言模型领域发生结构性变动。在对全球17款主流大模型深度横评中，国产AI阵营表现强劲，中文理解优势显著，综合得分反超海外顶尖模型。字节跳动Doubao-Seed-2.0-Pro-260215以90.66分登顶总榜，多款国产模型跻身第一梯队。

多模态大模型最新评测出炉！Gemini-3-Pro断层第一，豆包、商汤领跑国产阵营，Qwen3-VL成首个开源高分模型

SuperCLUE-VLM最新榜单显示，谷歌Gemini-3-Pro以83.64分大幅领先，在视觉理解与推理方面优势明显。国产模型表现突出，商汤SenseNova V6.5Pro和字节豆包分列第二、三位，展现中国AI在多模态领域的快速进步。评测涵盖三大核心能力维度。

SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

SuperCLUE-VLM多模态模型评测榜单发布，Gemini-2.5-Pro以74.99分排名第一，GPT-5(high)以68.59分位列第二。该基准针对中文场景设计，从基础认知、视觉推理和视觉应用三大维度评估模型性能，为行业发展提供客观标准。评测涵盖Claude-Opus-4.1、ERNIE-4.5-Turbo-VL等主流模型。

蚂蚁数科上线LingDT-2.6-flash 进一步为企业提供实用型AI工具

大模型竞争焦点正从性能比拼转向企业场景的规模化应用，追求低成本、高效率。蚂蚁数科推出Ling-2.6-flash商业版LingDT-2.6-flash，主打“Token效率”，相比同参数级别模型可节省90%Token消耗，更快更省，适配企业真实场景大规模部署。

中文视觉大模型竞争新局面：豆包夺魁，国产实力全面反超！

相关推荐

国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一

多模态大模型最新评测出炉！Gemini-3-Pro断层第一，豆包、商汤领跑国产阵营，Qwen3-VL成首个开源高分模型

多模态视觉大模型12月战报:Gemini 霸榜，豆包、商汤领跑国产阵营

SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

蚂蚁数科上线LingDT-2.6-flash 进一步为企业提供实用型AI工具

​中文视觉大模型竞争新局面：豆包夺魁，国产实力全面反超！

相关推荐

​国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一

多模态大模型最新评测出炉！Gemini-3-Pro断层第一，豆包、商汤领跑国产阵营，Qwen3-VL成首个开源高分模型

多模态视觉大模型12月战报:Gemini 霸榜，豆包、商汤领跑国产阵营

SuperCLUE多模态视觉8月评测榜：Gemini-2.5-Pro位居第一

蚂蚁数科上线LingDT-2.6-flash 进一步为企业提供实用型AI工具

中文视觉大模型竞争新局面：豆包夺魁，国产实力全面反超！

国产AI视觉大模型集体“反超”，豆包力压谷歌拿下全球第一