寒武紀今日宣佈,已基於 vLLM 推理框架完成對深度求索(DeepSeek)最新開源模型
針對
硬件層面,寒武紀深度挖掘了 MLU 的訪存與排序加速特性,有效應對
行業分析指出,DeepSeek-V4憑藉百萬字(1M)超長上下文及頂尖的邏輯推理性能,對底層算力架構提出了嚴苛要求。寒武紀在模型發佈首日的敏捷適配,不僅展示了國產算力平臺對超大規模、複雜結構模型的承載能力,也預示着國產 AI 產業鏈在軟硬協同層面已進入成熟期,爲大模型應用普惠提供了高效的算力底座支持。

寒武紀今日宣佈,已基於 vLLM 推理框架完成對深度求索(DeepSeek)最新開源模型
針對
硬件層面,寒武紀深度挖掘了 MLU 的訪存與排序加速特性,有效應對
行業分析指出,DeepSeek-V4憑藉百萬字(1M)超長上下文及頂尖的邏輯推理性能,對底層算力架構提出了嚴苛要求。寒武紀在模型發佈首日的敏捷適配,不僅展示了國產算力平臺對超大規模、複雜結構模型的承載能力,也預示着國產 AI 產業鏈在軟硬協同層面已進入成熟期,爲大模型應用普惠提供了高效的算力底座支持。
騰訊雲宣佈自2026年6月3日起大幅下調DeepSeek-V4系列模型調用價格,全面與官方售價持平。其中,DeepSeek-V4-Pro緩存命中價格降幅最高達97.5%,推理輸入和輸出價格均下調75%;DeepSeek-V4-Flash緩存命中價格也下調90%。
DeepSeek在發佈V4版五天後,灰度測試多模態識圖功能,新增“識圖模式”入口,支持圖片理解。實測顯示,其在基礎視覺理解、複雜人物和環境識別上表現優異,標誌着從文本向視覺交互的跨越。
DeepSeek-V4發佈僅10小時,北京大學DCAI團隊便通過最新開源的One-Eval評測框架,快速生成全量自動化評測報告。傳統大模型評測流程繁瑣,需耗費大量精力在搭建測試管道上,而One-Eval顯著提升了效率,標誌着行業進入新階段。
榮耀宣佈智能助理YOYO接入DeepSeek-V4大模型,成爲安卓首個整合該技術的智能體。升級聚焦性能、上下文理解與推理效率三大核心,顯著提升複雜指令與長文本對話處理能力,標誌着移動端AI體驗進入更高階段。
騰訊雲在TokenHub平臺推出DeepSeek-V4預覽版API,支持百萬級上下文長度,顯著提升自然語言處理能力。定價與DeepSeek官方一致,提供高性價比服務,並在國際站新加坡節點同步上架,覆蓋全球用戶。