8月21日,深度求索科技有限公司正式發佈了其最新版本的AI模型——DeepSeek-V3.1。此次升級標誌着公司在邁向Agent時代方面邁出了堅實的第一步,爲用戶提供了一個更加強大、高效且多功能的人工智能解決方案。
DeepSeek-V3.1的發佈帶來了多項重大改進。首先,該版本引入了混合推理架構,使得一個模型能夠同時支持思考模式與非思考模式,爲用戶提供了更靈活的選擇。在思考模式下,DeepSeek-V3.1-Think相較於之前的DeepSeek-R1-0528版本,能夠在更短的時間內給出答案,顯著提高了思考效率。此外,通過Post-Training優化,新模型在工具使用與智能體任務中的表現也得到了大幅提升。

爲了更好地服務用戶,官方App與網頁端模型已同步升級至DeepSeek-V3.1。用戶可以通過點擊“深度思考”按鈕,輕鬆實現思考模式與非思考模式之間的自由切換。同時,DeepSeek API也進行了同步升級,其中`deepseek-chat`對應非思考模式,`deepseek-reasoner`對應思考模式,且上下文容量已擴展至128K。此外,API Beta接口還新增了對`strict`模式的Function Calling支持,確保輸出的Function滿足schema定義。
DeepSeek-V3.1還增強了對Anthropic API格式的支持,使得用戶能夠輕鬆地將該模型的能力接入Claude Code框架。這爲開發者提供了更大的靈活性,進一步拓展了模型的應用場景。

在工具調用和智能體支持方面,DeepSeek-V3.1也取得了顯著進步。在編程智能體測評中,無論是使用內部框架還是在命令行終端環境下進行復雜任務測試,DeepSeek-V3.1相較於之前的版本都有了明顯的提升。在搜索智能體測評中,DeepSeek-V3.1在多項指標上也取得了較大提升,尤其是在需要多步推理的複雜搜索測試和多學科專家級難題測試中,其性能已大幅領先於之前的版本。
此外,DeepSeek-V3.1在思考效率方面也進行了優化。經過思維鏈壓縮訓練後,V3.1-Think在輸出token數減少20%-50%的情況下,各項任務的平均表現與R1-0528持平。同時,在非思考模式下,V3.1也能夠有效控制輸出長度,保持與之前版本相同的模型性能。
爲了進一步推動技術的開源與共享,DeepSeek-V3.1的Base模型已在Huggingface和魔搭平臺開源。Base模型在V3的基礎上重新進行了外擴訓練,增加了840B tokens的訓練量。
在價格方面,深度求索科技有限公司宣佈,自北京時間2025年9月6日凌晨起,將對DeepSeek開放平臺API接口調用價格進行調整,執行新版價格表,並取消夜間時段優惠。在9月6日前,所有API服務仍按原價格政策計費,用戶可繼續享受當前優惠。同時,公司已進一步擴容API服務資源,以更好地滿足用戶的調用需求。
開源鏈接:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
官方文檔:
https://api-docs.deepseek.com/zh-cn/guides/anthropic_api
