火山引擎官微今日宣佈,正式發佈豆包大模型1.6-vision。據介紹,豆包大模型1.6-vision是豆包大模型家族首個具備工具調用能力的視覺深度思考模型,擁有更強的通用多模態理解和推理能力,並支持Responses API。

image.png

豆包大模型1.6-vision包括三大優勢,包括:

調用工具,視覺理解更精準。以工具調用的差異化能力,將圖像融入其思維鏈中,實現對圖片的定位、剪裁、點選、畫線、縮放、旋轉等精細處理。並通過模擬人類從“從全局掃描到局部聚焦”的視覺推理過程,在增強推理可解釋性的同時,可高效精準地完成圖像操作。

應用開發更高效。支持 Responses API,可自主選擇調用工具,大幅度減少 Agent 開發過程中的代碼量,提升開發效率,讓開發者應用開發更加高效。

更高模型性價比。對比上一版視覺理解模型 Doubao-1.5-thinking-vision-pro,綜合成本降低約50%,以更低成本解鎖更強性能,性價比再次躍升!