螞蟻集團旗下具身智能公司靈波科技今日宣佈,全面開源其具身基座模型 LingBot-VLA 的真機後訓練工具鏈。開發團隊可基於這套工具鏈,使用自有數據將 LingBot-VLA 快速遷移到自有機器人和具體任務中。

當前,具身智能領域開源模型持續增多,但把模型真正部署到自己的機器人上,仍需要完成一系列適配工作。由於不同機器人在機械臂構型、末端執行器、傳感器配置和控制接口等方面存在差異,開發團隊通常需要圍繞真機部署開展大量工程工作。這套工程鏈路往往是各團隊的核心 know-how,過去鮮有完整開放。

此次開源針對真機適配過程中的核心需求,覆蓋四個關鍵環節:支持多LeRobot 數據合併、關節維度映射標準化的數據處理工具,面向真機場景優化的訓練配置,離線評測工具,以及支持編譯加速的真機部署模塊。模型同時提供含深度和不含深度兩個版本,方便開發團隊根據自身需求進行選擇。

作爲螞蟻靈波開源的具身基座模型,LingBot-VLA 基於 2 萬小時真實機器人數據預訓練,覆蓋 9 種主流雙臂機器人構型,具備跨本體、跨任務泛化能力。在真機和仿真評測中,LingBot-VLA 均優於行業基準 π0.5,並已與樂聚、鬆靈、星海圖等廠商完成多機型驗證。

據悉,LingBot-VLA 僅需 150 條演示數據即可實現高質量的任務遷移。得益於底層代碼庫的深度優化,其訓練效率達到 StarVLA、OpenPI 等主流框架的 1.5~2.8 倍,進一步降低模型適配所需的數據和算力成本。

目前,LingBot-VLA 代碼庫已在 GitHub 開源(github.com/Robbyant/lingbot-vla),模型權重同步發佈於 Hugging Face 和 ModelScope。