DeepSeek發佈V3.1版本，上下文窗口翻倍至128K tokens

北京，2025年8月19日 — DeepSeek今日正式發佈其旗艦大語言模型的最新迭代版本DeepSeek-V3.1，該版本在保持完全API兼容性的前提下，將上下文窗口容量從64k tokens大幅擴展至128k tokens，標誌着該公司在開源AI技術領域的又一重要里程碑。

技術升級與市場定位

DeepSeek-V3.1距離前一版本DeepSeek-V3-0324的發佈僅相隔五個月時間。V3-0324版本於今年3月發佈，在推理能力、編程效率和數學計算等核心性能指標方面實現了顯著提升，爲本次V3.1版本的進一步優化奠定了堅實基礎。

在當前全球AI技術競爭日趨激烈的背景下，DeepSeek的快速產品迭代策略充分展現了其技術創新能力和市場響應速度。儘管面臨國際制裁帶來的高端計算資源獲取限制，DeepSeek依然通過創新的高效訓練方法和優化策略，在開源大語言模型領域保持了強勁的競爭優勢。

擴展上下文處理能力:V3.1版本的核心升級在於上下文窗口的翻倍擴容，使模型能夠處理更長的多輪對話序列和複雜的查詢任務，爲用戶提供更連貫和深入的交互體驗。

優化輸出結構:根據早期用戶反饋，V3.1在語言表達風格方面進行了顯著優化，模型現在更傾向於生成結構化輸出內容，包括表格、列表等格式化數據呈現，提升了信息的可讀性和實用性。

增強物理理解能力:新版本在物理現象模擬和相關概念理解方面表現出明顯改進，爲科學計算和工程應用場景提供了更強的支撐能力。

架構延續與優化:V3.1繼續採用經過驗證的專家混合（MoE，Mixture of Experts）架構設計，針對常規推理任務進行了專門優化，在此類應用場景下無需啓用"DeepThink"深度思考模式，既保證了處理效率又維持了輸出質量。

DeepSeek-V3.1目前已在多個平臺同步上線，包括DeepSeek官方網站、移動應用程序以及微信小程序等主要用戶接入渠道。該公司特別強調了API接口的完全向後兼容性，確保現有用戶和開發者能夠無縫遷移至新版本，無需修改現有的集成代碼或調用方式。

雖然截至發稿時，Hugging Face平臺尚未提供V3.1版本的模型權重文件下載，但DeepSeek重申了其對開源社區的長期承諾，承諾將繼續遵循開源發佈策略，爲全球AI研究社區和開發者提供技術支持。

DeepSeek-V3.1的發佈進一步鞏固了該公司在中國AI技術創新領域的領先地位，也爲全球開源大語言模型的發展貢獻了重要的技術進步。隨着上下文處理能力的顯著提升和多項性能優化的實現，V3.1有望在企業級應用、學術研究和個人用戶場景中發揮更大的價值。