Meta推VFusion3D:單張2D圖片或文本描述轉化爲高質量3D對象

近日，Meta 與牛津大學的研究團隊共同開發了一款名爲 VFusion3D 的強大 AI 模型。這個模型的功能令人振奮，它能將單張2D 圖片或文本描述轉化爲高質量的3D 對象，標誌着3D 內容創作的一個重要飛躍，尤其在虛擬現實、遊戲和數字設計等領域中，有着巨大的潛力。

研究團隊由 Junlin Han、Filippos Kokkinos 和 Philip Torr 領導，他們針對 AI 領域長期存在的挑戰進行了深入研究:3D 訓練數據的稀缺。爲了克服這一難題，他們巧妙地利用了預訓練的視頻 AI 模型，生成合成的3D 數據，從而訓練出更強大的3D 生成系統。

在實際測試中，VFusion3D 展現出了令人印象深刻的效果。在與之前的頂尖系統對比時，人類評估者更傾向於選擇 VFusion3D 生成的3D 重建，比例超過90%。更讓人驚訝的是，這個模型僅需幾秒鐘就能從一張圖片中生成3D 資產。

我親自體驗了一下 VFusion3D 的功能，試用了它在 Hugging Face 上提供的公開 Demo。這個界面非常簡單友好，用戶可以上傳自己的圖片或選擇一些預加載的示例，包括皮卡丘、達斯・維達等經典角色，甚至還有一隻揹着書包的小豬。

儘管技術表現非常出色，但也並非完美。研究人員指出，該系統在處理特定物體類型（如車輛和文字）時有時會遇到困難。隨着視頻 AI 模型的不斷髮展，這些問題有望得到改善。

Meta 的 VFusion3D 展示瞭如何通過巧妙的數據生成方法來開拓機器學習的新領域。隨着技術的不斷進步，我們有理由相信，未來將會有更多設計師和開發者能夠輕鬆使用這些強大的3D 創作工具。

產品入口:https://junlinhan.github.io/projects/vfusion3d.html

劃重點:
🌟 VFusion3D 能夠將單張2D 圖片或文本轉化爲高質量的3D 模型，推動3D 內容創作的革命。
🚀 該模型在與其他頂尖系統對比中，90% 的評估者更青睞 VFusion3D 的生成效果。
💡 未來，VFusion3D 可能會改變設計和開發的工作流程，讓創意產業變得更加高效與民主化。

騰訊擬接盤Manus成最大股東，估值20億美元發力智能體生態

7月10日消息，騰訊正洽談成爲新加坡AI初創Manus最大股東。此前Meta於2025年底達成的超20億美元（約136億元）收購交易已被要求撤銷。現有股東騰訊、真格基金、紅杉中國及管理層擬以同樣估值支持撤銷該交易，騰訊將在此輪認購最多股份，交易完成後或保留少數股權。

Meta推VFusion3D:單張2D圖片或文本描述轉化爲高質量3D對象

相關推薦

用“@”就能讓 AI 改你照片?Meta 剛上線的新功能被罵到連夜下架

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

騰訊擬接盤Manus成最大股東，估值20億美元發力智能體生態

Meta攜手博通與臺積電，自研AI芯片“Iris”將於9月正式量產

Meta被曝研發全天候AI眼鏡：支持超級感知與無感音視頻捕捉

Meta推VFusion3D:單張2D圖片或文本描述轉化爲高質量3D對象

相關推薦

用“@”就能讓 AI 改你照片?Meta 剛上線的新功能被罵到連夜下架

​Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

騰訊擬接盤Manus成最大股東，估值20億美元發力智能體生態

Meta攜手博通與臺積電，自研AI芯片“Iris”將於9月正式量產

Meta被曝研發全天候AI眼鏡：支持超級感知與無感音視頻捕捉

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能