DeepSeek-V4預覽版正式發佈:1M 超長上下文進入全員普惠時代

深度求索（DeepSeek）今日宣佈其全新系列模型DeepSeek-V4預覽版本正式上線並同步開源。該系列模型通過結構創新，實現了1M（一百萬字）超長上下文能力的標準化，在 Agent 協作、世界知識及邏輯推理性能上均達到國內及開源領域的領先水平。

雙版本佈局:Pro 追求極致，Flash 兼顧效率

DeepSeek-V4根據應用需求分爲兩個規格:

DeepSeek-V4-Pro（1.6T參數，激活49B）: 性能直擊頂級閉源模型。在 Agentic Coding 評測中達到開源最佳水平，交付質量接近 Opus4.6;在數學、STEM 及競賽代碼測評中，超越所有公開評測的開源模型，展現出世界頂級的推理性能。
DeepSeek-V4-Flash（284B參數，激活13B）: 主打極致性價比。雖然世界知識儲備略遜於 Pro 版，但在簡單任務的推理能力和 Agent 表現上與 Pro 版旗鼓相當，能提供更快捷、經濟的 API 服務。

結構創新:DSA 機制實現長上下文普惠

DeepSeek-V4開創性地採用了 DSA 稀疏注意力機制。通過在 Token 維度進行壓縮，模型大幅降低了超長上下文對計算量和顯存的需求。這意味着1M 上下文將成爲 DeepSeek 所有官方服務的標配，解決了長文本處理高昂成本的行業痛點。

深度適配 Agent 生態

針對當前主流的 Agent 產品（如 Claude Code、CodeBuddy 等），DeepSeek-V4進行了專項優化。模型支持非思考模式與思考模式，並在 API 中開放了 reasoning_effort 參數，允許用戶根據任務複雜度調節思考強度（high/max），顯著提升了在代碼生成和文檔處理等複雜場景下的表現。

訪問與開源計劃

目前，用戶可通過官網或官方 App 體驗最新模型，API 亦已同步更新。值得注意的是，舊有的 deepseek-chat 與 deepseek-reasoner 模型名將於三個月後（2026年7月24日）停用。

開源鏈接: 已在Hugging Face與魔搭社區上線。
技術報告: 同步披露於Hugging Face倉庫中。

此次DeepSeek-V4的發佈，不僅驗證了開源模型在長上下文與 Agent 能力上追趕頂級閉源模型的可行性，更通過技術架構的突破，爲 AGI 的普惠化進程提供了堅實的底座支持。

DeepSeek-V4模型開源鏈接:

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

DeepSeek-V4預覽版正式發佈:1M 超長上下文進入全員普惠時代

雙版本佈局:Pro 追求極致，Flash 兼顧效率

結構創新:DSA 機制實現長上下文普惠

深度適配 Agent 生態

訪問與開源計劃

相關推薦

OpenAI被曝正籌備發佈新一代雙向語音模型“GPT-Bidi-1”

Anthropic 緊急叫停 Claude Agent SDK 計費變更，重度用戶暫續現有訂閱限額

大廠也吃不消 AI 鉅額賬單！微軟智能體考慮換用幻方 DeepSeek

徹底告別複雜操作！蘋果iPadOS27 全面進化讓平板秒變電腦

防止AI依賴風險升級:蘋果擬在Siri中加入“休息一下”提示機制