近日,Nvidia 在加州圣地亚哥举行的 NeurIPS AI 大会上宣布了一系列新基础设施和 AI 模型,旨在为物理 AI 的发展奠定基础,包括可以感知和与真实世界互动的机器人和自动驾驶车辆。
其中,最引人注目的是 Alpamayo-R1,这是一款专为自动驾驶研究而设计的开放推理视觉语言模型。Nvidia 称这是首个聚焦于自动驾驶的视觉语言行为模型,能够处理文本和图像,帮助车辆 “看” 到周围环境并做出相应决策。

Alpamayo-R1模型基于 Nvidia 的 Cosmos-Reason 模型,后者专注于在作出响应前进行思考和推理。Nvidia 在2025年1月首次发布了 Cosmos 模型系列,并在8月推出了更多模型。该公司表示,Alpamayo-R1的推出对那些希望达到四级自动驾驶(在特定区域和条件下完全自主)的大型企业至关重要。
Nvidia 希望这一推理模型能赋予自动驾驶汽车类似人类的 “常识”,更好地处理复杂的驾驶决策。此外,Nvidia 还在 GitHub 上发布了一系列新资源,包括逐步指南、推理资源和后续训练工作流程,统称为 Cosmos Cookbook,帮助开发者更好地使用和训练 Cosmos 模型,内容涵盖数据整理、合成数据生成和模型评估。
这些新举措表明 Nvidia 正全速进入物理 AI 领域,以其先进的 AI GPU 为新方向。Nvidia 的联合创始人兼首席执行官黄仁勋多次表示,物理 AI 将是 AI 发展的下一个浪潮。Nvidia 首席科学家 Bill Dally 也在夏季与 TechCrunch 的对话中强调了物理 AI 在机器人领域的重要性。他表示,未来机器人将在世界上扮演重要角色,而 Nvidia 希望成为所有机器人的 “大脑” 制造者,因此必须开发关键技术。
划重点:
🌟 Nvidia 推出了 Alpamayo-R1,这是首个专为自动驾驶设计的开放推理视觉语言模型。
🚗 该模型基于 Cosmos-Reason,旨在帮助车辆更好地理解周围环境并作出决策。
📚 同时,Nvidia 还提供了 Cosmos Cookbook,助力开发者有效训练和使用 AI 模型。
