火山引擎正式发布豆包大模型2.0(Doubao-Seed-2.0)系列,同步上线面向企业和开发者的 API 服务,个人用户可通过火山方舟体验中心或豆包 App「专家」模式体验。
该版本围绕大规模生产环境需求完成系统性优化,凭借高效推理、多模态理解、复杂指令执行等能力,可更好应对真实世界复杂任务,且推理成本较业界顶尖模型降低约一个数量级,其日均 Tokens 使用量较推出初期已增长超500倍。

豆包大模型2.0提供四款差异化模型,适配不同场景的延迟、成本需求:Pro 版作为旗舰模型,主攻复杂深度推理、Agent 等高难度任务;Lite 版全面优于1.8版本,能力提升且 Tokens 消耗更少,性价比突出;Mini 版以速度和成本为先,能力媲美1.6Pro 版;Code 版面向开发者优化,适配真实编程环境,与 TRAE 搭配使用效果更佳。
此次更新实现多模态理解能力的全面升级,在视觉理解领域达到业界顶尖水平,Pro 版在空间理解 MMSIBench、运动理解 MotionBench、视频理解 VideoMME 等测评中领先 Gemini3pro,图表理解 CharXiv-RQ 能力也大幅提升。
针对视频场景,模型强化了时间序列与运动感知理解,在 TVBench 等关键测评中领先,EgoTempo 基准得分超人类,长视频评测中超越多数顶尖模型,可实现实时视频流分析、主动指导等交互,适配健身、穿搭等陪伴场景,还能精准推理台球走位、识别运动动作并给出专业指导。
模型的 LLM 与 Agent 能力也实现大幅强化,通过补充长尾领域知识,更好适配专业场景任务:Pro 版在 SuperGPQA 得分超 GPT5.2,HealthBench 斩获第一,科学领域成绩与 Gemini3Pro、GPT5.2持平;HLE-text 以54.2分领跑全球,IMO 测评超越 Gemini3pro,工具调用、指令遵循等维度表现优异,STEM 基准部分场景得分超 Gemini3Pro。
同时模型指令遵循的一致性和可控性增强,擅长长链路多步骤任务,可完成 “找资料 - 归纳 - 结论” 的连续工作流,还能结合工具完成从数据处理、内容创作到生图排版的全流程任务,基于其构建的智能客服 Agent 可实现客户对话、问题转接、售后回访等全链路服务。此外,Code 版模型可稳定调用主流 IDE 工具,前端能力优化显著,支持自定义技能,与 TRAE 结合能大幅提升开发效率,仅需5轮提示词即可构建出 “AI 春节庙会” 这类复杂 Web 应用,相关素材已开源。
为解决 Agent 时代 Tokens 使用量激增问题,火山引擎同步更新 Coding Plan 套餐包,开发者可在火山方舟调用该模型,新用户首月最低8元即可使用,实现不同编程任务的模型精准匹配。
