據《白鯨實驗室》獨家消息,備受期待的 DeepSeek V4 與姚順雨新混元模型將於 2026 年 4 月正式發佈。DeepSeek V4 是由梁文鋒主導研發的多模態大模型,經過長期的打磨與提升,預計在代碼能力和長期記憶方面都有顯著進展。這一模型的發佈與 DeepSeek 團隊近年來的研究方向相符,尤其是在視覺內容處理和人工智能搜索能力上。

梁文鋒的研究集中於 “條件記憶” 機制的探討,他在 2026 年 1 月發佈的論文《Conditional Memory via Scalable Lookup》中提出了相關理論。此外,2025 年 12 月,他又發表了《mHC: Manifold-Constrained Hyper-Connections》,進一步優化底層架構。這些研究旨在解決 Transformer 模型在記憶和訓練穩定性上的不足。DeepSeek V4 不僅具備強大的多模態處理能力,還將深度適配國產芯片,力求成爲第一個完全依賴國產算力的核心模型。

與此同時,姚順雨的新混元模型也將在 4 月發佈。姚順雨自 2025 年 12 月起擔任騰訊總辦首席 AI 科學家,並同時負責 AI Infra 部門和大語言模型部。他在 2026 年 2 月發佈的論文 CL-bench 提出了針對 “上下文學習” 的新評測基準,強調長上下文與 Agent 可用性的重要性。根據相關消息,姚順雨的新模型將擁有約 30 億個參數,且他的團隊從一開始就重視模型的實際應用而非單純的參數競賽。

兩者的發佈不僅引發了市場的高度關注,也預示着中國在人工智能領域的快速發展。無論是 DeepSeek V4 的長期記憶能力,還是騰訊混元模型在真實任務評測方面的進展,都在努力回答未來大模型如何更好地適應生產環境的問題。