自動駕駛也要玩“元宇宙”？極佳科技用AI腦補，讓4D場景重建更絲滑！

近日，極佳科技提出了一種名爲 DriveDreamer4D 的全新框架，旨在利用世界模型的先驗知識來提升4D 駕駛場景的重建效果。

傳統的4D 場景重建方法，主要依賴於 NeRF 和3DGS 這兩大流派。NeRF 就好比一個超級畫家，它能用神經網絡，把一堆照片渲染成一個3D 模型。而3DGS 則是用一堆三維高斯函數，來模擬場景中的各種物體。

但這兩種方法都有個致命弱點:太依賴訓練數據了!就好比，你只見過直線行駛的汽車，突然來個漂移過彎，你就懵逼了。所以，在面對複雜路況，比如變道、加速、減速的時候，它們就容易翻車。

爲了解決這個問題，極佳科技這次祭出了一個大殺器——DriveDreamer4D。這玩意兒，簡單來說，就是給4D 場景重建加了個 AI 外掛——世界模型。

世界模型，你可以理解成一個 AI 大腦，它能根據已有的數據，預測未來可能發生的情況。DriveDreamer4D 就是利用世界模型，來生成各種複雜路況下的新視角視頻數據，相當於給4D 場景重建模型餵了“腦補”的訓練數據，讓它見多識廣，不再翻車。

更牛逼的是，DriveDreamer4D 還專門設計了一個新軌跡生成模塊（NTGM）。這玩意兒，能自動生成各種符合交通規則的新軌跡，比如變道、加速、減速等等，然後用世界模型生成對應視角的視頻，相當於給4D 場景重建模型請了個“陪練”，讓它在各種複雜路況下都能遊刃有餘。

實驗結果也證明了 DriveDreamer4D 的實力。在處理複雜路況時，它的重建效果明顯優於傳統方法，生成圖像的保真度更高，而且還能準確地還原車輛和車道線的位置。

總而言之，DriveDreamer4D 的出現，就像是在4D 場景重建領域扔了一顆核彈，直接炸開了技術的天花板。有了它，自動駕駛的研發和測試，將會更加高效、安全和可靠。

當然，DriveDreamer4D 目前還處於研究階段，未來還有很多可以改進的地方。但我相信，隨着技術的不斷髮展，它將會越來越強大，最終成爲自動駕駛領域不可或缺的一部分。

論文地址：https://arxiv.org/pdf/2410.13571

項目主頁:https://drivedreamer4d.github.io/

代碼地址:https://github.com/GigaAI-research/DriveDreamer4D

前商湯科技高管創立的流形空間融資近 10 億元，躍升爲世界模型獨角獸！

前商湯科技高管武偉創立的流形空間（ManifoldAI）近日完成數億元融資，投資方涵蓋國新基金、淡馬錫旗下毅峯資本、北汽產投及芯能創投，老股東亦超額追加。公司成立僅一年內即完成六輪融資，累計金額近10億元，迅速躋身賽道前列。

上傳一張圖片即時生成一個3D世界，靈光App率先將世界模型搬上移動端

螞蟻靈光App上線“體驗世界模型”功能，成爲業界首個移動端AGI產品。用戶上傳一張圖片，即可在手機上最長60秒探索3D世界，支持手遊式視角操控，從觸發到探索僅需秒級。這是業內首次在端側實現世界模型，具備分鐘級長時一致性與實時交互能力。

從零開始預訓練，螞蟻靈波發佈具身原生世界動作模型LingBot-VA2.0