在具身智能領域徘徊了三週的“神祕模型”身份終於揭曉。此前,一個名爲MotuBrain的模型在物理世界理解與動作執行的兩大國際基準測試中悄然登頂,引發業內廣泛猜測。近日,憑藉視頻大模型Vidu聲名鵲起的生數科技正式宣佈,該模型正是其在具身智能領域的最新商業化成果。
這次“跨界”並非玩票。MotuBrain在WorldArena(考察物理世界理解)和RoboTwin2.0(考察動作執行)中均刷新了歷史記錄。尤其在模擬隨機擾動的複雜環境下,它是唯一平均分突破95分的模型,展現了極強的泛化能力。

“邊看邊動”:打破感知與行動的邊界
不同於傳統的“先想象再執行”模式,MotuBrain採用了創新的“世界動作模型”(World Action Model)路徑。這種“邊看邊動”的設計,讓機器人在決策的同時進行推演,確保預測與執行的偏差不會被相互放大,極大地提升了響應速度。
在實際演示中,搭載該系統的機器人展示了極高的智能化水平。在火鍋局場景下,機器人能通過視覺判斷勺子是否爲空,並自主決定是否重新撈取,而非僵化地重複預設動作。這種“察言觀色”的能力,標誌着機器人正從簡單的機械執行轉向真正的智能決策。

一腦多型,實現長程任務的絲滑銜接
MotuBrain的核心優勢在於其強大的通用性。它不僅支持“一腦多型”,可適配不同自由度和傳感器的機器人本體,更具備“一腦貫通”的長程任務處理能力。在插花、調酒、整理沙發等演示中,機器人能夠連續完成超過10個原子動作,過程行雲流水,無需人工干預。
數據顯示,隨着任務種類的增加,MotuBrain的學習成功率呈上升趨勢。這說明模型掌握的是物理世界的通用底層規律,而非死記硬背動作模版。任務越多樣,其表現越出色。
佈局物理世界,數字與實體雙軌並行
生數科技此次展示的實力,源於其深厚的技術積澱。通過全球首創的U-ViT架構,公司實現了數字世界生成(VGM)與物理世界執行(WAM)的統一。左手Vidu生成虛擬世界,右手MotuBrain驅動實體交互,這種雙軌佈局使其在數據獲取成本與模型迭代速度上具備顯著優勢。
目前,生數科技已與無界動力、星塵智能等多家企業達成戰略合作。隨着具身智能競爭重心的轉移,擁有通用化“大腦”的模型開發者正成爲重塑行業格局的關鍵力量。