近日,一款名爲 Direct3D-S2的全新3D 生成框架引發了業界熱議。該框架通過創新的 空間稀疏注意力(SSA)機制,顯著提升了高分辨率3D 圖像生成的質量與效率,爲千兆級3D 生成提供了更具可擴展性的解決方案。AIbase 綜合整理最新信息,帶您深入瞭解 Direct3D-S2的技術突破與應用前景。

image.png

空間稀疏注意力:效率與質量的雙重飛躍

Direct3D-S2的核心創新在於其 空間稀疏注意力(SSA)機制,專爲處理稀疏體視數據設計。該機制通過優化擴散變換器(DiT)的計算方式,顯著降低了訓練和推理的資源需求。據悉,SSA 機制使前向傳播速度提升3.9倍,反向傳播速度提升9.6倍,極大縮短了生成高分辨率3D 模型的時間。相比傳統方法,Direct3D-S2在保持高質量輸出的同時,訓練成本大幅降低,展現了卓越的效率優勢。

統一稀疏體視格式:提升訓練穩定性

Direct3D-S2採用了一種統一的 稀疏體視變分自編碼器(VAE),在輸入、潛在表示和輸出階段保持一致的稀疏體視格式。相較於依賴異構表示的傳統3D VAE,這種設計顯著提高了訓練的穩定性和效率。得益於此,Direct3D-S2能夠在1024³ 分辨率下進行訓練,僅需8塊 GPU,而傳統方法通常需要32塊 GPU 才能完成256³ 分辨率的訓練,標誌着千兆級3D 生成的實用性邁上新臺階。

生成質量超越業界標杆

Direct3D-S2在公開數據集上的測試表現令人矚目,其生成質量不僅超越了現有最先進的3D 生成方法,還在細節捕捉和幾何精度上表現出色。生成的3D 形狀展現了更高的分辨率和更精細的表面細節,適用於虛擬現實、遊戲開發、工業設計等多個領域。AIbase 觀察到,Direct3D-S2的高分辨率生成能力有望爲複雜3D 建模任務提供全新解決方案。

開源計劃:賦能全球開發者

最新消息,Direct3D-S2的代碼和模型權重將在近期公開,具體時間預計在5月底之前。這一開源舉措將進一步推動3D 生成技術在全球開發者社區中的普及與應用。儘管具體開源許可尚未明確,但業界對其開放性寄予厚望,期待其成爲推動3D 內容創作的催化劑。

3D 生成的未來風向

Direct3D-S2的發佈標誌着高分辨率3D 生成技術的一次重大飛躍。其空間稀疏注意力機制和高效的訓練框架不僅突破了傳統方法的計算瓶頸,還爲千兆級3D 生成提供了可擴展的解決方案。AIbase 認爲,隨着開源計劃的推進,Direct3D-S2有望在虛擬現實、增強現實、影視製作等領域引發廣泛應用,推動3D 內容創作進入更加高效和精細化的新時代。

結語

Direct3D-S2以其創新的空間稀疏注意力機制和高效的稀疏體視框架,爲高分辨率3D 生成樹立了新標杆。從顯著提速的訓練過程到超越業界的高質量輸出,這款框架展現了3D 生成技術的無限可能。

項目地址:https://github.com/DreamTechAI/Direct3D-S2