機器人技術正迎來從“工業自動化”向“物理 AI”跨越的關鍵時刻。據 IT之家 消息,微軟研究院正式推出了一款名爲 Rho-alpha 的全新 AI 模型。該模型致力於打破機器人對封閉、預設環境的依賴,使其能夠在複雜多變且不可預測的現實場景中大顯身手。

image.png

作爲微軟“物理 AI”戰略的核心成果,Rho-alpha 展現出了令人驚歎的交互能力。它能直接聽懂人類的自然語言指令,並將其轉化爲精確的控制信號,引導機器人完成極其複雜的雙手協同任務。這意味着,未來的機器人不再需要苦讀晦澀的代碼腳本,只需一句話,就能像人類一樣理解並執行操作。

在感知層面,Rho-alpha 走得更遠。它不僅繼承了 Phi 家族優秀的視覺與語言處理基因,還首次深度集成了觸覺感知。當機器人抓取物體時,它能根據真實的觸碰反饋實時微調動作力度和姿態。微軟透露,未來還將加入力感知等更多模態,讓機器人的操作精度達到新的高度。

爲了讓機器人更“聰明”、更合心意,Rho-alpha 引入了動態調整行爲的適應機制。在實際運行中,如果機器人表現不佳,人類操作者可以通過3D 輸入設備進行干預和糾正,而系統會將這些反饋實時吸收到學習過程中。通過 Azure 基礎設施生成的海量仿真數據與真實世界演示數據的深度融合,Rho-alpha 正在加速進化,力求成爲真正懂用戶偏好的智能助手。

劃重點:

  • 🗣️ 語言直控:Rho-alpha 模型實現了自然語言與機器人控制信號的直接轉換,支持複雜的雙手協同操作,擺脫了傳統預設腳本的束縛。

  • 🖐️ 觸覺進化:該模型在視覺基礎上引入了觸覺反饋機制,使機器人能根據實際觸感實時調整行爲,未來還將增加力感知模態以提升精度。

  • 🔄 持續學習:系統支持人類實時干預與糾正,能通過3D 輸入設備學習用戶偏好,並結合仿真與真實數據不斷優化其在非結構化環境中的表現。