在科技的江湖裏,Google DeepMind又扔出了一個重磅炸彈——他們把一個叫Gemini1.5Pro的系統裝到了機器人身上。這可不是普通的升級,這玩意兒讓機器人有了記憶導航的超能力,簡直就是給機器人開了個“天眼”。
想象一下,這個機器人在將近9000平方英尺的地盤上,能執行57種不同的任務,而且成功率達到了90%。這不是簡單的任務,比如找到畫畫的地方,機器人不僅聽懂了,還帶你找到了一塊大白板。這操作,簡直比真人還靠譜。
這個系統的厲害之處在於,它能夠處理多模態的長上下文窗口,這意味着機器人不僅能記住關鍵位置,還能理解人類的指令、視頻導覽,甚至用常識來推理。就像那個Google員工的例子,機器人不僅聽懂了“畫畫的地方”,還知道要找個有大白板的地方。
而且,這些機器人在之前的項目中已經熟悉了辦公室環境,它們通過“多模態指令導航演示”瞭解了空間佈局。DeepMind的團隊還用了一種分層視覺-語言-動作(VLA)技術,讓機器人能夠理解書面、繪圖命令和手勢指令。
這個系統的核心,是它能夠讓機器人在複雜的空間中自由行動,而且不需要人類時時刻刻的指導。它們能夠記住環境,理解指令,然後用自己的方式來完成任務。這種能力,讓機器人在實際應用中變得更加靈活和有用。
總之,Google DeepMind的這項技術,不僅僅是讓機器人變得更聰明,更是讓它們能夠在真實世界中更好地服務於人類。這就像是給機器人打開了一扇新的大門,讓它們能夠走進我們的生活,成爲我們工作和探索世界的夥伴。未來的機器人,或許就不再是冷冰冰的機器,而是我們生活中的智能夥伴。