正文

150條示教數據即可適配新機器人，螞蟻靈波開源LingBot-VLA後訓練代碼

發布於AI新閒資訊

時間 :May 13, 2026

閱讀 :1分鐘

螞蟻集團旗下具身智能公司靈波科技今日宣佈，全面開源其具身基座模型 LingBot-VLA 的真機後訓練工具鏈。開發團隊可基於這套工具鏈，使用自有數據將 LingBot-VLA 快速遷移到自有機器人和具體任務中。

當前，具身智能領域開源模型持續增多，但把模型真正部署到自己的機器人上，仍需要完成一系列適配工作。由於不同機器人在機械臂構型、末端執行器、傳感器配置和控制接口等方面存在差異，開發團隊通常需要圍繞真機部署開展大量工程工作。這套工程鏈路往往是各團隊的核心 know-how，過去鮮有完整開放。

此次開源針對真機適配過程中的核心需求，覆蓋四個關鍵環節：支持多LeRobot 數據合併、關節維度映射標準化的數據處理工具，面向真機場景優化的訓練配置，離線評測工具，以及支持編譯加速的真機部署模塊。模型同時提供含深度和不含深度兩個版本，方便開發團隊根據自身需求進行選擇。

作爲螞蟻靈波開源的具身基座模型，LingBot-VLA 基於 2 萬小時真實機器人數據預訓練，覆蓋 9 種主流雙臂機器人構型，具備跨本體、跨任務泛化能力。在真機和仿真評測中，LingBot-VLA 均優於行業基準 π0.5，並已與樂聚、鬆靈、星海圖等廠商完成多機型驗證。

據悉，LingBot-VLA 僅需 150 條演示數據即可實現高質量的任務遷移。得益於底層代碼庫的深度優化，其訓練效率達到 StarVLA、OpenPI 等主流框架的 1.5~2.8 倍，進一步降低模型適配所需的數據和算力成本。

目前，LingBot-VLA 代碼庫已在 GitHub 開源（github.com/Robbyant/lingbot-vla），模型權重同步發佈於 Hugging Face 和 ModelScope。

從零開始預訓練，螞蟻靈波發佈具身原生世界動作模型LingBot-VA2.0

7月10日，螞蟻靈波發佈業界首個具身原生世界動作模型LingBot-VA2.0。它標誌機器人基礎模型從數字世界嫁接轉向面向物理世界的原生設計，從動態建模、因果預測等與環境交互原始需求出發，打造機器人“大腦”。

螞蟻靈波開源全球首個面向具身智能的MoE架構視頻生成模型LingBot-Video。該模型圍繞機器人需求重構預訓練，系統性提升推理效率、物理合理性、動作理解與任務完成度，爲具身智能提供開源底座，並在北大與字節跳動聯合發佈的RBench基準上得到驗證。

螞蟻集團Robbyant開源LingBot-Vision模型家族，通過自監督視覺Transformer與創新“邊界建模”，在密集空間感知任務上表現卓越，多項指標超越數倍參數的大模型，突破了現有視覺基礎模型偏重物體識別的侷限，讓機器人精準感知物理空間成現實。

宇樹科技陳立在2026亞布力論壇上表示，具身智能正處爆發前夜，預計2-5年將實現突破。其“ChatGPT時刻”標誌爲：機器人能在80%陌生場景中，憑語音文字指令精準完成約80%任務。他預判這一節點臨近。

智元創新發布“具身智能數採2.0”，聚焦機器人適應現實環境的難題，從數據運營、模型測評和場景落地三大維度升級，爲機器人研發注入核心動力。

智啟未來，您的人工智能解決方案智庫