豆包大模型1.6-vision正式發佈，對比上一代綜合成本降低約50%

火山引擎官微今日宣佈，正式發佈豆包大模型1.6-vision。據介紹，豆包大模型1.6-vision是豆包大模型家族首個具備工具調用能力的視覺深度思考模型，擁有更強的通用多模態理解和推理能力，並支持Responses API。

豆包大模型1.6-vision包括三大優勢，包括:

調用工具，視覺理解更精準。以工具調用的差異化能力，將圖像融入其思維鏈中，實現對圖片的定位、剪裁、點選、畫線、縮放、旋轉等精細處理。並通過模擬人類從“從全局掃描到局部聚焦”的視覺推理過程，在增強推理可解釋性的同時，可高效精準地完成圖像操作。

應用開發更高效。支持 Responses API，可自主選擇調用工具，大幅度減少 Agent 開發過程中的代碼量，提升開發效率，讓開發者應用開發更加高效。

更高模型性價比。對比上一版視覺理解模型 Doubao-1.5-thinking-vision-pro，綜合成本降低約50%，以更低成本解鎖更強性能，性價比再次躍升!

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

NVIDIA推出Nemotron3Embed嵌入向量模型系列，專爲生產級RAG、智能體檢索、代碼檢索和記憶場景設計。8B版本在RTEB基準測試中排名第一，成爲性能最強的開源嵌入模型。系列包含三個開放檢查點：精度優先的Nemotron-3-Embed-8B-BF16、輕量化的1B-BF16版，以及針對Blackwell架構優化的1B-NVFP4四比特版本，所有模型均採用雙向注意力機制。

豆包大模型1.6-vision正式發佈，對比上一代綜合成本降低約50%

相關推薦

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

銀河通用機器人創始人王鶴： 2028 年，具身智能的 “ChatGPT 時刻” 即將來臨！

超低延遲 AI 對話神器！Wan-Streamer v0.2 讓你與 AI 零距離溝通

文遠知行推出物理 AI 大模型 WITT

百度沈抖：每位員工每月發 1000 元額度自由體驗主流大模型，強制推行AI辦公難見效