AIbase 報道,正值 DeepSeek-R1發佈一週年之際,DeepSeek 下一代旗艦模型的線索已悄然浮出水面。結合 The Information 的爆料,這款備受期待的新模型(或爲 DeepSeek V4)最快有望於今年2月中旬(農曆新年期間)正式登場,並預計帶來更強悍的代碼生成能力。

DeepSeek

開發者在 DeepSeek 的 GitHub 倉庫中發現,其更新的 FlashMLA 代碼庫中,橫跨114個文件有多達28處引用了名爲 “MODEL1” 的神祕標識符。代碼邏輯顯示,“MODEL1” 是一個區別於現有 “V32”(DeepSeek-V3.2)的全新架構。二者的關鍵差異體現在鍵值(KV)緩存佈局、稀疏性處理方式以及 FP8數據格式的解碼支持上,這表明新模型在內存優化和計算效率方面進行了針對性的底層重構。

此前,DeepSeek 團隊已陸續發佈了關於“優化殘差連接(mHC)”和受生物學啓發的“AI 記憶模塊(Engram)”等技術論文。業界普遍猜測,這些最新的研究成果極有可能被整合進正在開發的“MODEL1”中,爲這款即將發佈的新旗艦提供核心技術支撐。