最近、Nvidiaはカリフォルニア州サクラメントで開催されたNeurIPS AI会議で、物理AIの発展を促進するための新規インフラとAIモデルのシリーズを発表しました。これは、現実世界を感知し、それに反応するロボットや自律走行車両の基盤となるものです。
その中でも最も注目されているのは、自律走行研究に特化したオープンリゾン・ビジョン言語モデル「Alpamayo-R1」です。Nvidiaによると、これは初めて自律走行を専門にしたビジョン言語行動モデルであり、テキストと画像を処理し、車が周囲の環境を「見る」ことができ、適切な意思決定を行うことを可能にします。

Alpamayo-R1モデルは、NvidiaのCosmos-Reasonモデルをベースとしています。この後者は、返答を行う前に思考と推論を行うことに焦点を当てています。Nvidiaは、2025年1月にCosmosモデルシリーズを最初に発表し、8月にはさらに多くのモデルを公開しました。同社は、Alpamayo-R1の登場が、特定の地域と条件下で完全に自律的な4レベルの自動運転を目指す大手企業にとって非常に重要であると述べています。
Nvidiaはこのリゾンモデルにより、自律走行車に人間のような「常識」をもたらし、複雑な運転判断をより良く行えるようにしたいと考えています。また、GitHub上で、ステップバイステップのガイド、リゾンリソース、および後続のトレーニングワークフローを含む新しいリソースシリーズを公開しました。これらは「Cosmos Cookbook」として統合され、開発者がCosmosモデルを効果的に使用およびトレーニングするのに役立ちます。内容はデータ整理、合成データ生成、モデル評価などをカバーしています。
これらの新規取り組みは、Nvidiaが物理AI分野への参入を加速していることを示しています。同社は、先進的なAI GPUを新たな方向性としています。Nvidiaの共同創業者兼CEOの黄仁勲氏は、物理AIがAI発展の次の波になると繰り返し述べています。また、Nvidiaの最高科学者であるBill Dally氏も夏にTechCrunchとの対談で、物理AIがロボティクス分野において重要な役割を果たすことを強調しました。彼は、将来的にロボットが世界で重要な役割を果たすことになるとし、Nvidiaはすべてのロボットの「脳」の製造者になることを目指しており、そのためには関連技術を開発しなければならないと語っています。
ポイント:
🌟 Nvidiaは、自律走行専用のオープンリゾン視覚言語モデルであるAlpamayo-R1を発表しました。
🚗 このモデルはCosmos-Reasonに基づいており、車が周囲の環境をよりよく理解し、意思決定を行うことを目的としています。
📚 また、NvidiaはCosmos Cookbookを提供しており、開発者がAIモデルを効果的に使用およびトレーニングできるように支援しています。
