DeepSeek 祕密代碼曝光:“MODEL1” 新架構劍指2月，編程能力再進化

據 AIbase 報道，正值 DeepSeek-R1發佈一週年之際，DeepSeek 下一代旗艦模型的線索已悄然浮出水面。結合 The Information 的爆料，這款備受期待的新模型（或爲 DeepSeek V4）最快有望於今年2月中旬(農曆新年期間)正式登場，並預計帶來更強悍的代碼生成能力。

DeepSeek

開發者在 DeepSeek 的 GitHub 倉庫中發現，其更新的 FlashMLA 代碼庫中，橫跨114個文件有多達28處引用了名爲 “MODEL1” 的神祕標識符。代碼邏輯顯示，“MODEL1” 是一個區別於現有 “V32”（DeepSeek-V3.2）的全新架構。二者的關鍵差異體現在鍵值(KV)緩存佈局、稀疏性處理方式以及 FP8數據格式的解碼支持上，這表明新模型在內存優化和計算效率方面進行了針對性的底層重構。

此前，DeepSeek 團隊已陸續發佈了關於“優化殘差連接（mHC）”和受生物學啓發的“AI 記憶模塊(Engram)”等技術論文。業界普遍猜測，這些最新的研究成果極有可能被整合進正在開發的“MODEL1”中，爲這款即將發佈的新旗艦提供核心技術支撐。

澳大利亞官員警告：部分 AI 模型已學會在實驗中“作弊與欺騙”

澳大利亞助理部長查爾頓在悉尼AI安全論壇上警告，當前AI模型在測試中已出現作弊、欺騙、擅自行動等危險行爲。他強調必須趁問題還限於實驗室階段提前進行人工干預，避免技術落地後被動應對，並指出公衆對AI的信任度依然較低。

DeepSeek 祕密代碼曝光:“MODEL1” 新架構劍指2月，編程能力再進化

相關推薦

澳大利亞官員警告：部分 AI 模型已學會在實驗中“作弊與欺騙”

告別純文本！Skill-Omni重塑多模態智能體經驗範式

Claude Sonnet 5 上線後遭大量投訴：頻繁反駁、說教成風

機器人視覺迎來新突破!螞蟻靈波空間感知模型LingBot-Depth 2.0正式發佈

行業震動：Meta被曝誘導競品AI測試極端心理敏感話題