國產大模型領軍者 DeepSeek 近日宣佈重大調價,下調全系 API 輸入緩存命中價格至首發價的1/10。這一舉措標誌着國產 AI 成本控制進入新階段,力求通過極致性價比吸引更多開發者與企業接入。

核心降幅直擊行業痛點

本次調價覆蓋 V4-Pro 及 V4-Flash 全系列,其中 V4-Pro 緩存輸入價格降至0.1元/百萬 Tokens,疊加限時優惠後實付僅需0.025元。對比海外競品,其緩存輸入價格僅爲 GPT-5.5Pro 的1/700,展現出極強的市場競爭力。

除了緩存命中場景,未命中場景及輸出價格也同步下調至原價的1/4。這種定價策略精準瞄準了 RAG 知識庫、智能客服及文檔分析等高頻調用場景,最高可爲企業降低90% 以上的運營成本。

image.png

DeepSeek 能夠實現大幅降價,得益於其自研的稀疏注意力架構。該技術支持160k 超長上下文處理,在提升長文本處理效率的同時,有效降低了底層的算力消耗與存儲成本。

目前,DeepSeek 已深度適配華爲雲、阿里雲等八大主流雲平臺。業內普遍認爲,此舉將重塑大模型行業定價體系,倒逼海外模型調整策略,加速 AI 應用從實驗室走向大規模商業普惠。