NVIDIAが物理AIを放り出し、再び開発：オープンソースの自動運転推論モデルAlpamayo-R1が車両に思考をもたらす

カリフォルニア州サンディエゴ発——NeurIPS2025会場で、NVIDIAは初のL4レベル自動運転向けの推論視覚言語アクションモデル「Alpamayo-R1」を発表し、同時にGitHubとHugging Faceに公開しました。新しいモデルは今年8月にリリースされたCosmos-Reasonシリーズに基づいており、カメラ、レーザーラジアル、テキストコマンドを一度に処理でき、内部的な推論を経て運転判断を出力します。公式には、このモデルが車両に「人間の常識」を注入したとされています。

NVIDIA

Alpamayo-R1の特徴：

- 一貫性のあるアーキテクチャ：視覚＋言語＋アクションの3モダリティをエンドツーエンドで訓練し、モジュールごとの誤差の重ね合わせを防ぎます

- 推論プロセス：Cosmosの思考プロセスにより、「前車が急ブレーキをかけた」「歩行者が横断する」などのシナリオに対して複数ステップにわたる推論を行い、加速・ブレーキ・ハンドリング信号を出力します

- 即時利用可能：重み、推論スクリプト、評価ツールが「Cosmos Cookbook」としてまとめて配布され、開発者は必要に応じて微調整できます

NVIDIAの首席科学者ビル・ダリー氏は、「ロボットと自動運転は次のAIブームの中心となる。我々はすべてのロボットの脳になるべきだ」と語っています。新モデルの発表に伴い、会社はデータ合成、モデル評価、および後学習のフルワークフローのガイドラインも公開し、自動車メーカーおよびRobotaxiチームが制限されたエリアでL4機能を迅速に検証することを奨励しています。

アナリストは、オープンソースの推論モデルが自動車メーカーの自社開発のハードルを大幅に下げることになると見ていますが、機能安全認証を通過し、車載用のリアルタイム要件を満たすことができるかどうかは、Alpamayo-R1の商業化に先立って越えなければならない課題です。

インスタントアセンブリと復旦大学が共同でオープンソース化：AI画像の正確なレイアウト制御を実現

小紅書と復旦大学はAIペイント技術「InstanceAssemble」を発表し、AIペイントにおける構図作成の難しさを解決し、単純なシーンから複雑なシーンに至るまで正確な画像生成を実現しました。関連論文は頂級会議であるNeurIPS2025に掲載されました。

Nvidiaが新たなAIモデルAlpamayo-R1を公開、自動運転研究の進展に貢献

NVIDIAはNeurIPSで新AIインフラとモデルを発表、物理AIの発展を促進し、ロボットや自動運転車の現実世界認識を支援。特に自動運転向け初のオープン推論視覚言語モデル「Alpamayo-R1」をリリースし、テキストと画像処理による車両環境認識能力を向上。....

NeurIPS 2025 最優論文発表：アリババ通義千問がゲート付き注目機構で中国唯一の賞を受賞

アリババの通義千問チームがNeurIPS 2025で最優秀論文賞を受賞。論文『Attention Gating Makes Better Foundation Models』は「スライドゲート」機構を提案し、標準アテンション後に学習可能なゲートを追加して重要ヘッドとトークンを動的に選別。1.7Bパラメータモデルが15B MoEモデルと同等性能を達成。応募2万件中4作品の受賞作で唯一の中国成果。....

グーグル検索のAIモードが全量リリース：結果ページ内でワンタッチで会話、ステップの移動は歴史となった

Googleモバイル検索のAIモードが全世界で開始。結果ページでGeminiと直接対話でき、即時追及や多輪対話が可能に。従来の複数回遷移を「1スクロール・1クリック質問」に簡素化。質問を複数サブトピックに分解し、知識グラフ・リアルタイムスポーツ・金融・ショッピングデータを並行取得する「クエリ扇出」技術を採用。....

千問APPが万相Wan2.5の動画機能を統合し、ビデオ能力が大幅に向上