寒武纪今日宣布,已基于 vLLM 推理框架完成对深度求索(DeepSeek)最新开源模型
针对
硬件层面,寒武纪深度挖掘了 MLU 的访存与排序加速特性,有效应对
行业分析指出,DeepSeek-V4凭借百万字(1M)超长上下文及顶尖的逻辑推理性能,对底层算力架构提出了严苛要求。寒武纪在模型发布首日的敏捷适配,不仅展示了国产算力平台对超大规模、复杂结构模型的承载能力,也预示着国产 AI 产业链在软硬协同层面已进入成熟期,为大模型应用普惠提供了高效的算力底座支持。

寒武纪今日宣布,已基于 vLLM 推理框架完成对深度求索(DeepSeek)最新开源模型
针对
硬件层面,寒武纪深度挖掘了 MLU 的访存与排序加速特性,有效应对
行业分析指出,DeepSeek-V4凭借百万字(1M)超长上下文及顶尖的逻辑推理性能,对底层算力架构提出了严苛要求。寒武纪在模型发布首日的敏捷适配,不仅展示了国产算力平台对超大规模、复杂结构模型的承载能力,也预示着国产 AI 产业链在软硬协同层面已进入成熟期,为大模型应用普惠提供了高效的算力底座支持。
腾讯云宣布自2026年6月3日起大幅下调DeepSeek-V4系列模型调用价格,全面与官方售价持平。其中,DeepSeek-V4-Pro缓存命中价格降幅最高达97.5%,推理输入和输出价格均下调75%;DeepSeek-V4-Flash缓存命中价格也下调90%。
DeepSeek在发布V4版五天后,灰度测试多模态识图功能,新增“识图模式”入口,支持图片理解。实测显示,其在基础视觉理解、复杂人物和环境识别上表现优异,标志着从文本向视觉交互的跨越。
DeepSeek-V4发布仅10小时,北京大学DCAI团队便通过最新开源的One-Eval评测框架,快速生成全量自动化评测报告。传统大模型评测流程繁琐,需耗费大量精力在搭建测试管道上,而One-Eval显著提升了效率,标志着行业进入新阶段。
荣耀宣布智能助理YOYO接入DeepSeek-V4大模型,成为安卓首个整合该技术的智能体。升级聚焦性能、上下文理解与推理效率三大核心,显著提升复杂指令与长文本对话处理能力,标志着移动端AI体验进入更高阶段。
腾讯云在TokenHub平台推出DeepSeek-V4预览版API,支持百万级上下文长度,显著提升自然语言处理能力。定价与DeepSeek官方一致,提供高性价比服务,并在国际站新加坡节点同步上架,覆盖全球用户。