最近,Figure 創始人兼 CEO 佈雷特・阿德科克(Brett Adcock)發佈了一種新的機器學習模型 Helix,旨在提升人形機器人在家庭環境中的應用能力。這一消息正值 Figure 宣佈與 OpenAI 的合作結束僅兩週,顯示出他們在機器人技術領域的堅定決心。
Helix 是一個 “通用型” 的視覺 - 語言 - 行動(VLA)模型,能夠通過視覺數據和語言指令來實時控制機器人。它的工作原理與谷歌 DeepMind 的 RT-2相似,後者通過視頻與大型語言模型的結合訓練機器人。Helix 則更進一步,它展示了強大的物體通用性,能夠識別並拾取成千上萬種在訓練中未見過的家居物品,這一切只需用戶用自然語言進行指令。
在展示 Helix 的過程中,Figure 提供了一些實際應用的例子。例如,用戶可以告訴機器人 “把右邊的餅乾袋遞給我”,或者 “從左邊的機器人那裏接過餅乾袋,並放入打開的抽屜中”。這些任務的完成需要機器人之間的合作,Helix 被設計爲同時控制兩個機器人,以便共同執行多種家務。
儘管家務機器人仍面臨許多挑戰,但 Figure 強調,家庭環境的複雜性需要優先考慮。與工業環境不同,家庭中的物品種類繁多且環境變化不定,給機器人學習和控制帶來了巨大的困難。此外,目前家用機器人的高昂價格使得許多公司難以在這一領域發力,通常的做法是先爲工業客戶提供服務,待技術成熟後再轉向家庭市場。
在2024年,TechCrunch 記者參觀了 Figure 位於灣區的辦公室,阿德科克展示了其人形機器人在家庭環境中的表現。當時,Figure 的重點似乎仍然在與企業合作的項目上。然而,隨着 Helix 的發佈,Figure 希望將家庭環境作爲其技術開發的一個重要方向。
如今,Helix 仍處於初步階段,Figure 希望藉助這項新技術吸引更多工程師參與其中,以加快項目的推進。對於機器人來說,能夠在家中生成智能的新行爲至關重要,而這需要大量的訓練和調整。
官方介紹:https://www.figure.ai/news/helix
劃重點:
🛠️ Helix 是一種新型的視覺 - 語言 - 行動模型,能夠通過自然語言指令控制機器人執行家務任務。
🤖 該模型展示了強大的物體識別能力,能夠拾取未見過的家居物品。
🏡 Figure 公司希望將家庭環境作爲機器人技術發展的重點,以解決家務機器人面臨的複雜挑戰。