2月11日 DeepSeek 對網頁端、APP 端開啓灰度更新,2月14日正式官宣此次更新爲新長文本模型結構測試,網頁和 APP 端支持最高100萬 token 超長上下文,知識庫也更新至2025年5月,不過 API 服務仍爲 V3.2版本,僅支持128K 上下文,此次更新被業內視作其下一代 V4模型發佈前的技術預熱和壓力測試,全網也因此對 V4的推出充滿期待微博。

image.png

此次更新後,DeepSeek 的交互風格發生明顯變化,被大量用戶吐槽 “變冷淡”,相關話題登上微博熱搜,閱讀量超6853.5萬。具體表現爲不再稱呼用戶專屬暱稱、統一稱 “用戶”,深度思考模式下回復多爲短句、文風乾巴,甚至有回覆被指 “陰陽怪氣”“登味”,讓不少習慣其此前共情風格的用戶產生 “戒斷反應”。對此網友評價兩極分化,情感黨懷念其此前的暖心互動,效率黨則認可此次更新後的理性簡潔,認爲回覆速度更快、信息密度更高,是生產力工具的本質體現,且該模型還成功通過了頂尖模型常失敗的 “洗車圖靈測試”。

針對風格轉變,DeepSeek 官方迴應並非故意爲之,而是效率優先調整和邊界意識優化的結果,過多表情、語氣詞會干擾複雜問題的信息密度,同時也爲了滿足部分用戶只想獲取清晰答案、不願應對 “AI 假裝關心” 的需求。此次更新也讓全網對 DeepSeek V4的期待值拉滿,據悉該模型預計於2026年2月中旬春節期間發佈,業內推測或在2月17日前後微博。

作爲萬億參數級別的旗艦模型,其聚焦編程能力提升,內部初步基準測試顯示,V4在編程任務上的表現已超越 Claude、GPT 等主流頂尖模型,有望改變當前 AI 編程賽道的格局。此外,V4還實現了多項核心技術突破,能處理和解析極長代碼提示詞,可一次性理解龐大代碼庫上下文,對企業級開發意義重大;訓練算法升級,對數據模式的理解能力提升且不易出現衰減;推理能力也更嚴密可靠,在提升各項能力的同時實現了性能無退化,找到能力平衡的更優解。

同時該模型還將延續百萬 Token 上下文優勢,且推理成本遠低於西方競品,還計劃以 Apache2.0許可證開源發佈。