挪威的初創公司1X Technologies 最近宣稱,他們在爲機器人開發基於人工智能的世界模型方面取得了重大進展。簡單來說,這些模型就像是機器人的虛擬試驗場,能夠讓機器在各種情境中進行測試和改進,完全不需要真刀真槍的實地測試。

1X 認爲,這正是解決 “機器人難題” 的關鍵所在 —— 也就是如何在不斷變化的環境中,可靠地評估爲多種任務而訓練的機器人。以一臺能摺疊 T 恤的機器人爲例,它在50天的時間裏表現不一,成就感常常轉瞬即逝。

image.png

1X 表示,即便是同樣的機器人型號,在環境變化時也會出現巨大的表現波動,這讓進行嚴格的現實評估變得異常困難。

爲了訓練他們的世界模型,1X 收集了數千小時的視頻資料,記錄了他們的人形機器人 EVE 在家庭和辦公室中執行各種任務的過程。通過機器學習,模型現在能夠合理預測物體和環境在機器人行動下的反應。即使是那些未被明確編程的行爲,模型也能生成可信的影像輸出,比如學習到應避免接觸人類和物體。

目前,1X 的模型已經能夠處理一些複雜的物理交互,例如抓取和舉起物體、打開門和抽屜,以及處理像衣物這樣的可變形材料,甚至能摺疊 T 恤。

他們的世界模型的核心價值在於模擬物體的互動。例如,在接下來的幾代中,模型將獲得相同的初始畫面以及三組不同的動作來抓取箱子。在每種情況下,抓取的箱子會隨着機械手的動作被提起並移動,而其他箱子則保持原位。

儘管如此,1X 也承認了一些限制。比如,模型有時難以保持物體顏色和形狀的一致性,或者準確模擬物理現象。在鏡子中自我識別的能力也依舊不太可靠。

儘管面臨挑戰,1X 依然將這些世界模型視爲開發和訓練通用機器人的一個里程碑。爲了加速進展,該公司還通過 “1X 世界模型挑戰賽” 提供數據集、預訓練模型和獎金。

1X 的長遠目標是直接利用世界模型進行機器人訓練,這將比真實測試帶來巨大的效率提升。爲了實現這一目標,他們正在積極招募人工智能領域的專家。今年早些時候,1X 還成功籌集了1億美元的資金,以推動其家用人形機器人 Neo 的市場推出,這筆資金得到了像 OpenAI 這樣的行業領軍人物的支持,充分展現了對1X 技術的高期待。

除了1X,英偉達也在對人形機器人進行大量投資。該公司最近推出了一種使用蘋果 Vision Pro 的訓練方法,英偉達的研究員 Jim Fan 認爲,在未來幾年內,機器人技術將迎來一個 “GPT-3時刻”。