麻省理工學院本週展示了一種訓練機器人的新模型,旨在解決模仿學習在引入小挑戰時可能會失敗的問題。研究人員指出,模仿學習在照明、不同環境或新障礙等情況下可能會失敗,因爲機器人根本沒有足夠的數據來適應。
該團隊尋求像 GPT-4這樣的模型來尋找一種強力數據方法來解決問題。他們引入了一種名爲異構預訓練變壓器(HPT)的新架構,該架構將來自不同傳感器和不同環境的信息彙集在一起。然後使用變壓器將數據彙總到訓練模型中。變壓器越大,輸出越好。

用戶可以輸入機器人設計、配置和他們想要完成的工作,然後使用新模型訓練機器人。研究人員表示,這種方法可以實現機器人策略方面的突破,就像大型語言模型一樣。
這項研究的部分資金來自豐田研究院。去年,豐田研究院在 TechCrunch Disrupt 上首次展示了一種一夜之間訓練機器人的方法。最近,該公司達成了一項具有里程碑意義的合作伙伴關係,將把其機器人學習研究與波士頓動力硬件結合起來。
卡內基梅隆大學副教授戴維·赫爾德表示:“我們的夢想是擁有一個通用的機器人大腦,你可以下載它並使用它,而無需任何訓練。雖然我們還處於早期階段,但我們將繼續努力,希望規模化能帶來機器人策略方面的突破,就像大型語言模型一樣。”
