近日,Meta 與牛津大學的研究團隊共同開發了一款名爲 VFusion3D 的強大 AI 模型。這個模型的功能令人振奮,它能將單張2D 圖片或文本描述轉化爲高質量的3D 對象,標誌着3D 內容創作的一個重要飛躍,尤其在虛擬現實、遊戲和數字設計等領域中,有着巨大的潛力。

image.png

研究團隊由 Junlin Han、Filippos Kokkinos 和 Philip Torr 領導,他們針對 AI 領域長期存在的挑戰進行了深入研究:3D 訓練數據的稀缺。爲了克服這一難題,他們巧妙地利用了預訓練的視頻 AI 模型,生成合成的3D 數據,從而訓練出更強大的3D 生成系統。

在實際測試中,VFusion3D 展現出了令人印象深刻的效果。在與之前的頂尖系統對比時,人類評估者更傾向於選擇 VFusion3D 生成的3D 重建,比例超過90%。更讓人驚訝的是,這個模型僅需幾秒鐘就能從一張圖片中生成3D 資產。

我親自體驗了一下 VFusion3D 的功能,試用了它在 Hugging Face 上提供的公開 Demo。這個界面非常簡單友好,用戶可以上傳自己的圖片或選擇一些預加載的示例,包括皮卡丘、達斯・維達等經典角色,甚至還有一隻揹着書包的小豬。

儘管技術表現非常出色,但也並非完美。研究人員指出,該系統在處理特定物體類型(如車輛和文字)時有時會遇到困難。隨着視頻 AI 模型的不斷髮展,這些問題有望得到改善。

Meta 的 VFusion3D 展示瞭如何通過巧妙的數據生成方法來開拓機器學習的新領域。隨着技術的不斷進步,我們有理由相信,未來將會有更多設計師和開發者能夠輕鬆使用這些強大的3D 創作工具。

產品入口:https://junlinhan.github.io/projects/vfusion3d.html

劃重點:

🌟 VFusion3D 能夠將單張2D 圖片或文本轉化爲高質量的3D 模型,推動3D 內容創作的革命。  

🚀 該模型在與其他頂尖系統對比中,90% 的評估者更青睞 VFusion3D 的生成效果。  

💡 未來,VFusion3D 可能會改變設計和開發的工作流程,讓創意產業變得更加高效與民主化。