NVIDIA 最新推出的 Edify3D 技術在3D 資產生成領域取得重大突破。這項創新技術能在短短兩分鐘內,基於文本描述或參考圖像生成包含完整 UV 貼圖、4K 紋理和 PBR 材質的高品質3D 模型,爲遊戲設計、影視製作和擴展現實等行業帶來革命性解決方案。
Edify3D 採用了獨特的技術架構,將多視角擴散模型與基於 Transformer 的重建技術相結合。其核心管線包含三個關鍵步驟:
多視角擴散模型根據輸入生成多個視角的 RGB 圖像;
多視角 ControlNet 合成對應的表面法線;
重建模型將這些信息整合成神經3D 表示,通過等值面提取和網格後處理生成最終的幾何體。
在實際應用中,Edify3D 展現出卓越的性能表現。它不僅能生成具有精確網格結構的3D 模型,還能保證紋理的高分辨率和材質貼圖的完整性。系統支持生成從揹包、留聲機到機器人手臂等多樣化的3D 資產,且生成的模型都具有自適應的四邊形網格拓撲結構,便於後期編輯和渲染。
特別值得一提的是,Edify3D 還可用於生成複雜的3D 場景。通過與大語言模型(LLM)結合,系統能夠根據文本提示定義場景佈局、物體位置和尺寸,創建連貫且真實的3D 場景組合。這一功能爲藝術設計、3D 建模和 AI 模擬等應用提供了強大支持。
在技術擴展性方面,Edify3D 表現出色。隨着訓練視角數量的增加,模型生成的圖像質量和一致性不斷提升。重建模型的性能也會隨着輸入視角數量的增加而改善,同時還能根據計算資源靈活調整三平面令牌大小。
這項技術的發佈標誌着3D 內容創作進入新紀元,爲相關行業帶來前所未有的效率提升和創作可能。
詳細介紹:https://research.nvidia.com/labs/dir/edify-3d/