據《科創板日報》消息,DeepSeek 即將於下週發佈其最新的大型模型 ——V4。這款新模型備受期待,具備圖像、視頻和文本生成功能,標誌着 DeepSeek 在多模態技術上的又一次飛躍。

據知情人士透露,DeepSeek V4 在硬件適配上將全面支持國產算力,目的是優化與中國製造芯片的兼容性。這不僅有望提升中國市場對其半導體產品的需求,還能加速 AI 模型在推理階段與本土芯片的融合。

在 V4 發佈的同時,DeepSeek 還計劃推出一份簡短的技術說明,預計一個月後會有更詳盡的技術報告。這一系列動作顯示了 DeepSeek 在技術透明度和市場反應上的決心。

目前,DeepSeek 的 “V4 Lite” 測試版本也正在進行中。這一版本被稱爲 “sealion-lite”,具有 100 萬 tokens 的上下文窗口,相較於 V3 系列的 128K 提升了近 8 倍,理論上能夠一次性處理《三體》全集的文本量。值得注意的是,V4 Lite 是原生多模態架構,意味着它在預訓練階段就將文本和視覺理解相結合,而非後期拼接。

從參數規模來看,V4 Lite 預計有 2000 億參數,而完整的 V4 版本參數可能會突破 1 萬億。此外,V4 Lite 在生成 SVG 圖像的能力上也表現出色,使用極簡代碼(僅 54 行)即可生成高質量圖像,顯示出其在空間推理和結構化輸出方面的提升。

回顧 DeepSeek 的發展歷程,該公司自 2023 年以來在推理能力和模型效率上不斷創新。自 2024 年發佈 V2 以來,DeepSeek 不斷追求綜合性能與推理效率的平衡。到 2025 年,DeepSeek 推出的 V3 系列不僅確立了強大的綜合性能基礎,更通過持續的小版本更新提升了用戶體驗。

總的來看,DeepSeek 在等待 V4 發佈的同時,始終在技術革新和多模態能力的佈局上不遺餘力。這無疑將爲 AI 領域帶來新的活力與可能性。