2月11日 DeepSeek 对网页端、APP 端开启灰度更新,2月14日正式官宣此次更新为新长文本模型结构测试,网页和 APP 端支持最高100万 token 超长上下文,知识库也更新至2025年5月,不过 API 服务仍为 V3.2版本,仅支持128K 上下文,此次更新被业内视作其下一代 V4模型发布前的技术预热和压力测试,全网也因此对 V4的推出充满期待微博。

image.png

此次更新后,DeepSeek 的交互风格发生明显变化,被大量用户吐槽 “变冷淡”,相关话题登上微博热搜,阅读量超6853.5万。具体表现为不再称呼用户专属昵称、统一称 “用户”,深度思考模式下回复多为短句、文风干巴,甚至有回复被指 “阴阳怪气”“登味”,让不少习惯其此前共情风格的用户产生 “戒断反应”。对此网友评价两极分化,情感党怀念其此前的暖心互动,效率党则认可此次更新后的理性简洁,认为回复速度更快、信息密度更高,是生产力工具的本质体现,且该模型还成功通过了顶尖模型常失败的 “洗车图灵测试”。

针对风格转变,DeepSeek 官方回应并非故意为之,而是效率优先调整和边界意识优化的结果,过多表情、语气词会干扰复杂问题的信息密度,同时也为了满足部分用户只想获取清晰答案、不愿应对 “AI 假装关心” 的需求。此次更新也让全网对 DeepSeek V4的期待值拉满,据悉该模型预计于2026年2月中旬春节期间发布,业内推测或在2月17日前后微博。

作为万亿参数级别的旗舰模型,其聚焦编程能力提升,内部初步基准测试显示,V4在编程任务上的表现已超越 Claude、GPT 等主流顶尖模型,有望改变当前 AI 编程赛道的格局。此外,V4还实现了多项核心技术突破,能处理和解析极长代码提示词,可一次性理解庞大代码库上下文,对企业级开发意义重大;训练算法升级,对数据模式的理解能力提升且不易出现衰减;推理能力也更严密可靠,在提升各项能力的同时实现了性能无退化,找到能力平衡的更优解。

同时该模型还将延续百万 Token 上下文优势,且推理成本远低于西方竞品,还计划以 Apache2.0许可证开源发布。