DeepSeek-V3.1發佈：更高思考效率更強Agent 能力

8月21日，深度求索科技有限公司正式發佈了其最新版本的AI模型——DeepSeek-V3.1。此次升級標誌着公司在邁向Agent時代方面邁出了堅實的第一步，爲用戶提供了一個更加強大、高效且多功能的人工智能解決方案。

DeepSeek-V3.1的發佈帶來了多項重大改進。首先，該版本引入了混合推理架構，使得一個模型能夠同時支持思考模式與非思考模式，爲用戶提供了更靈活的選擇。在思考模式下，DeepSeek-V3.1-Think相較於之前的DeepSeek-R1-0528版本，能夠在更短的時間內給出答案，顯著提高了思考效率。此外，通過Post-Training優化，新模型在工具使用與智能體任務中的表現也得到了大幅提升。

微信截圖_20250821145744.png

爲了更好地服務用戶，官方App與網頁端模型已同步升級至DeepSeek-V3.1。用戶可以通過點擊“深度思考”按鈕，輕鬆實現思考模式與非思考模式之間的自由切換。同時，DeepSeek API也進行了同步升級，其中`deepseek-chat`對應非思考模式，`deepseek-reasoner`對應思考模式，且上下文容量已擴展至128K。此外，API Beta接口還新增了對`strict`模式的Function Calling支持，確保輸出的Function滿足schema定義。

DeepSeek-V3.1還增強了對Anthropic API格式的支持，使得用戶能夠輕鬆地將該模型的能力接入Claude Code框架。這爲開發者提供了更大的靈活性，進一步拓展了模型的應用場景。

微信截圖_20250821145433.png

在工具調用和智能體支持方面，DeepSeek-V3.1也取得了顯著進步。在編程智能體測評中，無論是使用內部框架還是在命令行終端環境下進行復雜任務測試，DeepSeek-V3.1相較於之前的版本都有了明顯的提升。在搜索智能體測評中，DeepSeek-V3.1在多項指標上也取得了較大提升，尤其是在需要多步推理的複雜搜索測試和多學科專家級難題測試中，其性能已大幅領先於之前的版本。

此外，DeepSeek-V3.1在思考效率方面也進行了優化。經過思維鏈壓縮訓練後，V3.1-Think在輸出token數減少20%-50%的情況下，各項任務的平均表現與R1-0528持平。同時，在非思考模式下，V3.1也能夠有效控制輸出長度，保持與之前版本相同的模型性能。

爲了進一步推動技術的開源與共享，DeepSeek-V3.1的Base模型已在Huggingface和魔搭平臺開源。Base模型在V3的基礎上重新進行了外擴訓練，增加了840B tokens的訓練量。

在價格方面，深度求索科技有限公司宣佈，自北京時間2025年9月6日凌晨起，將對DeepSeek開放平臺API接口調用價格進行調整，執行新版價格表，並取消夜間時段優惠。在9月6日前，所有API服務仍按原價格政策計費，用戶可繼續享受當前優惠。同時，公司已進一步擴容API服務資源，以更好地滿足用戶的調用需求。

開源鏈接:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

官方文檔:

https://api-docs.deepseek.com/zh-cn/guides/anthropic_api

DeepSeek-V3.1發佈：更高思考效率更強Agent 能力

相關推薦

Jan團隊發佈Jan-v2-VL-Max！30B多模態模型專攻長週期Agent任務，長序列執行穩超Gemini 2.5 Pro

上海市新增9款已完成登記生成式人工智能服務

字節跳動發佈 Seed Prover1.5:推動形式化數學推理的新進展

知乎2025年度 AI 產品榜單揭曉，豆包位居榜首

長跑型 AI 登場：Jan 團隊發佈 Jan-v2-VL，深度優化多步任務執行力

DeepSeek-V3.1發佈：更高思考效率 更強Agent 能力

相關推薦

Jan團隊發佈Jan-v2-VL-Max！30B多模態模型專攻長週期Agent任務，長序列執行穩超Gemini 2.5 Pro

上海市新增9款已完成登記生成式人工智能服務

字節跳動發佈 Seed Prover1.5:推動形式化數學推理的新進展

知乎2025年度 AI 產品榜單揭曉，豆包位居榜首

​長跑型 AI 登場：Jan 團隊發佈 Jan-v2-VL，深度優化多步任務執行力

DeepSeek-V3.1發佈：更高思考效率更強Agent 能力

長跑型 AI 登場：Jan 團隊發佈 Jan-v2-VL，深度優化多步任務執行力