智源研究院最近開源了 10 億參數的三維視覺通用模型 Uni3D。該模型能夠處理點雲數據,取得了主流三維視覺任務的全方位技術突破,展現出超強的通用視覺能力。Uni3D 的研發團隊借鑑了二維視覺模型的設計經驗,並引入多模態對齊的訓練方法,使其可以直接繼承二維視覺模型學習到的知識,取得強大的三維視覺能力。該模型在各類三維視覺任務上都取得了 state-of-the-art 的結果,展示了其強大的通用性和遷移學習能力。智源研究院表示,Uni3D 的開源發佈爲未來三維計算機視覺的研究和應用奠定了堅實的基礎。