英伟达扔下“物理 AI”重弹：开源自动驾驶推理模型Alpamayo-R1，让车辆先“思考”再踩油门

加州圣迭戈电——在NeurIPS2025现场，英伟达发布首款面向L4级自动驾驶的推理视觉语言动作模型Alpamayo-R1，并同步上线GitHub与Hugging Face。新模型基于今年8月推出的Cosmos-Reason系列，可一次性处理摄像头、激光雷达与文本指令，先内部推理再输出驾驶决策，官方称其给车辆注入“人类常识”。

英伟达

Alpamayo-R1亮点一览:

- 统一架构:视觉+语言+动作三模态端到端训练，避免分模块误差叠加

- 推理链路:Cosmos思维链让模型对“前车急刹、行人横穿”等场景进行多步推演，再输出加速/制动/转向信号

- 即开即用:权重、推理脚本与评估工具一并打包进“Cosmos Cookbook”，开发者可按需微调

英伟达首席科学家Bill Dally表示，机器人与自动驾驶将是下一波AI浪潮的核心，“我们要做所有机器人的大脑”。伴随新模型发布，公司同时推出数据合成、模型评测与后训练全流程指南，鼓励车企与Robotaxi团队在限定区域快速验证L4功能。

分析师认为，开源推理模型可显著降低车厂自研门槛，但能否通过功能安全认证、满足车规级实时要求，仍是Alpamayo-R1商业化前必须跨过的门槛。

英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

英伟达在NeurIPS大会上发布自动驾驶AI模型Alpamayo-R1（AR1），这是全球首个行业级开放推理视觉语言行动模型。它能同时处理文本和图像，将传感器信息转化为自然语言描述，结合推理链AI和路径规划技术，以应对复杂驾驶场景，加速无人驾驶汽车发展。

NeurIPS 2025 最佳论文揭晓：阿里通义千问靠“门控注意力”摘下中国唯一大奖

阿里巴巴通义千问团队在NeurIPS 2025获最佳论文奖，论文《Attention Gating Makes Better Foundation Models》提出“滑动门”机制，在标准注意力后添加可学习门控，动态筛选关键头和token参与下游计算。实验证明，1.7B稠密模型性能媲美15B MoE模型。本届大会投稿2万篇，录取率仅25%，竞争激烈，该论文是四篇获奖作品中唯一中国成果。

英伟达扔下“物理 AI”重弹：开源自动驾驶推理模型Alpamayo-R1，让车辆先“思考”再踩油门

相关推荐

小红书联合复旦开源 InstanceAssemble：实现 AI 图像精准排版控制

英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

Nvidia 发布新 AI 模型Alpamayo-R1，推动自动驾驶研究向前迈进

NeurIPS 2025 最佳论文揭晓：阿里通义千问靠“门控注意力”摘下中国唯一大奖

千问APP接入万相Wan2.5，视频能力全新升级

英伟达扔下“物理 AI”重弹：开源自动驾驶推理模型Alpamayo-R1，让车辆先“思考”再踩油门

相关推荐

​小红书联合复旦开源 InstanceAssemble：实现 AI 图像精准排版控制

​英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

​Nvidia 发布新 AI 模型Alpamayo-R1，推动自动驾驶研究向前迈进

NeurIPS 2025 最佳论文揭晓：阿里通义千问靠“门控注意力”摘下中国唯一大奖

千问APP接入万相Wan2.5，视频能力全新升级

小红书联合复旦开源 InstanceAssemble：实现 AI 图像精准排版控制

英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

Nvidia 发布新 AI 模型Alpamayo-R1，推动自动驾驶研究向前迈进