螞蟻靈波科技開源 LingBot-Map：支持單攝像頭實時流式三維重建

4月16日，螞蟻靈波科技正式宣佈開源流式三維重建模型 LingBot-Map。該模型突破性地實現了僅依靠單個普通 RGB 攝像頭，即可在視頻採集過程中實時估計相機位姿並重建場景三維結構。這一進展爲機器人導航、自動駕駛及 AR 硬件等需要即時空間感知的應用場景，提供了高效、穩定且連續的在線建圖能力。

技術層面，LingBot-Map 採用流式處理架構，改變了傳統方法需預先採集完整序列再統一處理的侷限，實現了邊接收畫面邊輸出定位與結構的實時交互。在國際主流評測中，該模型表現出色:在極具挑戰的 Oxford Spires 數據集上，其軌跡誤差僅爲此前最優流式方法的三分之一，甚至優於部分離線處理算法。性能指標顯示，LingBot-Map 支持約20FPS 的實時推理，並能在超萬幀的長視頻運行中保持精度幾乎不衰減，兼顧了高精度、高速度與長時穩定性。

此次 LingBot-Map 的發佈，是螞蟻靈波繼深度估計（Depth）、大語言動作模型(VLA)及世界模型(World)等系列成果後的又一重要動作。通過補齊實時空間理解這一核心環，螞蟻靈波進一步夯實了其具身智能“基座”的完整性。該模型的開源不僅降低了高精度三維感知的硬件門檻，更將加速具身智能設備在複雜動態環境中的感知與決策進化。

下載鏈接:

Hugging Face:https://huggingface.co/robbyant/lingbot-map

ModelScope:https://www.modelscope.cn/models/Robbyant/lingbot-map

螞蟻靈波開源2.7T深度數據集，200萬對真實樣本，覆蓋6款相機

螞蟻靈波科技開源大規模RGB-D深度數據集LingBot-Depth-Dataset，包含300萬對高質量樣本，其中200萬對來自真實場景採集，100萬對由渲染生成，總規模達2.71TB，覆蓋6款主流深度相機，是目前開源社區中規模最大的真實場景RGB-D數據集，將爲具身智能、空間感知和三維視覺等領域提供更豐富的數據支撐。

具身智能EAI-100評選出爐，螞蟻靈波入選年度十大突破與先鋒人物

3月22日，魔搭社區聯合多家權威機構發佈“EAI-100具身智能2025年度榜單”，系統評選該領域百項代表性成果與人物。螞蟻靈波科技同時入選“年度10大突破”與“先鋒人物20”兩大核心榜單。該評選強調真實、可驗證的產業貢獻與創新價值。

世界模型走入物理世界，螞蟻靈波開源LingBot-VA，讓機器人“先思後行”

螞蟻靈波科技開源具身世界模型LingBot-VA，首次提出自迴歸視頻-動作世界建模框架，將視頻生成與機器人控制深度融合。模型可同步生成未來世界狀態並輸出動作序列，實現“邊推演、邊行動”。真機評測顯示，該模型能有效應對複雜物理交互任務。

螞蟻靈波科技全面開源！雙模機器人新突破，空間感知更精準！

螞蟻集團旗下螞蟻靈波科技開源具身智能大模型LingBot-VLA及相關代碼，驗證了模型在不同機器人間的跨本體遷移能力，已適配星海圖、鬆靈、樂聚等多家廠商。通過其開發的後訓練工具鏈，在8卡GPU配置下可高效部署，推動智能機器人技術發展。

螞蟻靈波科技開源 LingBot-Map：支持單攝像頭實時流式三維重建

相關推薦

螞蟻靈波開源2.7T深度數據集，200萬對真實樣本，覆蓋6款相機

具身智能EAI-100評選出爐，螞蟻靈波入選年度十大突破與先鋒人物

世界模型走入物理世界，螞蟻靈波開源LingBot-VA，讓機器人“先思後行”

螞蟻靈波開源世界模型LingBot-World，高保真高動態，毫秒級實時交互

螞蟻靈波科技全面開源！雙模機器人新突破，空間感知更精準！