火山引擎正式發佈豆包大模型2.0(Doubao-Seed-2.0)系列,同步上線面向企業和開發者的 API 服務,個人用戶可通過火山方舟體驗中心或豆包 App「專家」模式體驗。
該版本圍繞大規模生產環境需求完成系統性優化,憑藉高效推理、多模態理解、複雜指令執行等能力,可更好應對真實世界複雜任務,且推理成本較業界頂尖模型降低約一個數量級,其日均 Tokens 使用量較推出初期已增長超500倍。

豆包大模型2.0提供四款差異化模型,適配不同場景的延遲、成本需求:Pro 版作爲旗艦模型,主攻複雜深度推理、Agent 等高難度任務;Lite 版全面優於1.8版本,能力提升且 Tokens 消耗更少,性價比突出;Mini 版以速度和成本爲先,能力媲美1.6Pro 版;Code 版面向開發者優化,適配真實編程環境,與 TRAE 搭配使用效果更佳。
此次更新實現多模態理解能力的全面升級,在視覺理解領域達到業界頂尖水平,Pro 版在空間理解 MMSIBench、運動理解 MotionBench、視頻理解 VideoMME 等測評中領先 Gemini3pro,圖表理解 CharXiv-RQ 能力也大幅提升。
針對視頻場景,模型強化了時間序列與運動感知理解,在 TVBench 等關鍵測評中領先,EgoTempo 基準得分超人類,長視頻評測中超越多數頂尖模型,可實現實時視頻流分析、主動指導等交互,適配健身、穿搭等陪伴場景,還能精準推理檯球走位、識別運動動作並給出專業指導。
模型的 LLM 與 Agent 能力也實現大幅強化,通過補充長尾領域知識,更好適配專業場景任務:Pro 版在 SuperGPQA 得分超 GPT5.2,HealthBench 斬獲第一,科學領域成績與 Gemini3Pro、GPT5.2持平;HLE-text 以54.2分領跑全球,IMO 測評超越 Gemini3pro,工具調用、指令遵循等維度表現優異,STEM 基準部分場景得分超 Gemini3Pro。
同時模型指令遵循的一致性和可控性增強,擅長長鏈路多步驟任務,可完成 “找資料 - 歸納 - 結論” 的連續工作流,還能結合工具完成從數據處理、內容創作到生圖排版的全流程任務,基於其構建的智能客服 Agent 可實現客戶對話、問題轉接、售後回訪等全鏈路服務。此外,Code 版模型可穩定調用主流 IDE 工具,前端能力優化顯著,支持自定義技能,與 TRAE 結合能大幅提升開發效率,僅需5輪提示詞即可構建出 “AI 春節廟會” 這類複雜 Web 應用,相關素材已開源。
爲解決 Agent 時代 Tokens 使用量激增問題,火山引擎同步更新 Coding Plan 套餐包,開發者可在火山方舟調用該模型,新用戶首月最低8元即可使用,實現不同編程任務的模型精準匹配。
