相关推荐
AMD 推出 vLLM-ATOM 插件,深度优化国产大模型推理表现
AMD发布vLLM-ATOM插件,旨在不改变现有工作流的前提下,充分挖掘硬件潜力,为DeepSeek-R1、Kimi-K2等主流大语言模型推理显著提速。vLLM本身是优化高并发场景吞吐量与显存利用率的开源框架,专注请求调度和缓存管理,ATOM插件则进一步强化了这一能力。
2026年5月12号 14:10
223.9k
加速国产大模型:AMD推出vLLM-ATOM插件大幅提升推理效率
AMD发布vLLM-ATOM插件,专为大语言模型部署优化,在不改变现有工作流下,显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制,利用vLLM框架的高显存利用率优势,让开发者以低学习成本实现技术迁移,获得性能平滑升级。
2026年5月12号 11:40
303.6k
OpenAI 联合英伟达等巨头发布 MRC 协议,重塑大规模 AI 训练网络架构
OpenAI联合AMD、博通、英特尔、微软及英伟达等五大巨头,发布多路径可靠连接(MRC)协议,旨在解决大规模AI训练中的网络延迟与故障问题。该协议已通过开放计算项目(OCP)开源,并推动从三层架构向两层设计的转变,以击碎“单点故障”,提升训练稳定性与效率。
2026年5月7号 14:20
216.5k
AMD:代理式 AI 时代,CPU 或将超越 GPU 的崛起
AMD CEO苏姿丰在2026年Q1财报电话会议中指出,随着代理式AI时代到来,数据中心CPU需求快速增长。传统“一CPU配多GPU”的模式正转向CPU与GPU数量接近一对一,未来CPU甚至可能超过GPU。CPU从主要调度角色变为更核心的计算节点,推动数据中心架构变革。
2026年5月6号 17:58
723.4k
AMD 斥资 2.5 亿美元投资 Nutanix,共同打造 AI 基础设施平台
AMD与Nutanix达成2.5亿美元战略合作,通过股权投资和联合研发,共同打造全栈AI基础设施平台,以增强企业本地AI部署能力,构建对抗英伟达的生态体系。
2026年2月26号 16:56
165.8k
