近日,Waymo 公司正式發佈了一款名爲 “端到端多模態自動駕駛模型”(EMMA)的 AI 研究模型。該模型專門爲自動駕駛技術進行了訓練和微調,利用 Gemini 的廣泛知識,旨在更好地理解複雜的道路場景。Waymo 在其發佈的研究論文中詳細介紹了該模型的設計理念和技術優勢,並探討了純端到端方法的優缺點。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
Waymo 表示,EMMA 模型是建立在 Gemini 的基礎之上,充分發揮了其能力,專注於自動駕駛的任務,如運動規劃和三維物體檢測。該模型在多個關鍵的自動駕駛任務中展現出良好的任務遷移能力。Waymo 指出,與爲每個任務訓練單獨模型相比,EMMA 在路徑預測、物體檢測和道路圖理解等方面的表現顯著提升。
Waymo 的研究結果顯示,EMMA 的構建爲未來更多核心自動駕駛任務的組合提供了一個有希望的研究方向。Waymo 的副總裁及研究負責人 Drago Anguelov 表示:“EMMA 展示了多模態模型在自動駕駛領域的強大能力與重要性,我們期待進一步探索多模態方法和組件如何助力構建更加通用和適應性強的駕駛系統。”
在處理原始攝像頭輸入和文本數據的能力方面,EMMA 也表現不俗。它能夠生成各種駕駛輸出,並通過建立統一的語言空間,充分利用 Gemini 的世界知識以及推理能力,增強決策過程,提高端到端規劃的效率。
Waymo 強調,這項研究的重要性不僅限於自動駕駛汽車的應用,還通過將先進的 AI 技術應用於現實世界任務,拓展了 AI 在複雜動態環境中的能力。
劃重點:
🚗 EMMA 模型專爲自動駕駛訓練,利用 Gemini 知識理解複雜道路場景。
📈 與傳統模型相比,EMMA 在關鍵任務上展現出更高效的表現。
🌍 研究成果不僅應用於自動駕駛,拓展了 AI 在動態環境中的應用潛力。
