相關推薦
AMD 推出 vLLM-ATOM 插件,深度優化國產大模型推理表現
AMD發佈vLLM-ATOM插件,旨在不改變現有工作流的前提下,充分挖掘硬件潛力,爲DeepSeek-R1、Kimi-K2等主流大語言模型推理顯著提速。vLLM本身是優化高併發場景吞吐量與顯存利用率的開源框架,專注請求調度和緩存管理,ATOM插件則進一步強化了這一能力。
May 12, 2026
223.9k
加速國產大模型:AMD推出vLLM-ATOM插件大幅提升推理效率
AMD發佈vLLM-ATOM插件,專爲大語言模型部署優化,在不改變現有工作流下,顯著提升DeepSeek-R1、Kimi-K2等國產大模型在AMD硬件上的推理性能。該插件針對Instinct系列GPU定製,利用vLLM框架的高顯存利用率優勢,讓開發者以低學習成本實現技術遷移,獲得性能平滑升級。
May 12, 2026
319.5k
OpenAI 聯合英偉達等巨頭髮布 MRC 協議,重塑大規模 AI 訓練網絡架構
OpenAI聯合AMD、博通、英特爾、微軟及英偉達等五大巨頭,發佈多路徑可靠連接(MRC)協議,旨在解決大規模AI訓練中的網絡延遲與故障問題。該協議已通過開放計算項目(OCP)開源,並推動從三層架構向兩層設計的轉變,以擊碎“單點故障”,提升訓練穩定性與效率。
May 7, 2026
216.5k
AMD:代理式 AI 時代,CPU 或將超越 GPU 的崛起
AMD CEO蘇姿豐在2026年Q1財報電話會議中指出,隨着代理式AI時代到來,數據中心CPU需求快速增長。傳統“一CPU配多GPU”的模式正轉向CPU與GPU數量接近一對一,未來CPU甚至可能超過GPU。CPU從主要調度角色變爲更核心的計算節點,推動數據中心架構變革。
May 6, 2026
723.4k
AMD 斥資 2.5 億美元投資 Nutanix,共同打造 AI 基礎設施平臺
AMD與Nutanix達成2.5億美元戰略合作,通過股權投資和聯合研發,共同打造全棧AI基礎設施平臺,以增強企業本地AI部署能力,構建對抗英偉達的生態體系。
Feb 26, 2026
165.8k
