深度求索(DeepSeek)今日宣佈其全新系列模型DeepSeek-V4預覽版本正式上線並同步開源。該系列模型通過結構創新,實現了1M(一百萬字)超長上下文能力的標準化,在 Agent 協作、世界知識及邏輯推理性能上均達到國內及開源領域的領先水平。

QQ20260424-112037.jpg

雙版本佈局:Pro 追求極致,Flash 兼顧效率

DeepSeek-V4根據應用需求分爲兩個規格:

  • DeepSeek-V4-Pro(1.6T參數,激活49B): 性能直擊頂級閉源模型。在 Agentic Coding 評測中達到開源最佳水平,交付質量接近 Opus4.6;在數學、STEM 及競賽代碼測評中,超越所有公開評測的開源模型,展現出世界頂級的推理性能。

  • DeepSeek-V4-Flash(284B參數,激活13B): 主打極致性價比。雖然世界知識儲備略遜於 Pro 版,但在簡單任務的推理能力和 Agent 表現上與 Pro 版旗鼓相當,能提供更快捷、經濟的 API 服務。

QQ20260424-110837.jpg

結構創新:DSA 機制實現長上下文普惠

DeepSeek-V4開創性地採用了 DSA 稀疏注意力機制。通過在 Token 維度進行壓縮,模型大幅降低了超長上下文對計算量和顯存的需求。這意味着1M 上下文將成爲 DeepSeek 所有官方服務的標配,解決了長文本處理高昂成本的行業痛點。

深度適配 Agent 生態

針對當前主流的 Agent 產品(如 Claude Code、CodeBuddy 等),DeepSeek-V4進行了專項優化。模型支持非思考模式思考模式,並在 API 中開放了 reasoning_effort 參數,允許用戶根據任務複雜度調節思考強度(high/max),顯著提升了在代碼生成和文檔處理等複雜場景下的表現。

QQ20260424-110847.jpg

訪問與開源計劃

目前,用戶可通過官網或官方 App 體驗最新模型,API 亦已同步更新。值得注意的是,舊有的 deepseek-chatdeepseek-reasoner 模型名將於三個月後(2026年7月24日)停用。

QQ20260424-110900.jpg

  • 開源鏈接: 已在Hugging Face魔搭社區上線。

  • 技術報告: 同步披露於Hugging Face倉庫中。

此次DeepSeek-V4的發佈,不僅驗證了開源模型在長上下文與 Agent 能力上追趕頂級閉源模型的可行性,更通過技術架構的突破,爲 AGI 的普惠化進程提供了堅實的底座支持。

  • DeepSeek-V4模型開源鏈接:

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4