Open-Sora Plan又升級了!最新發布的Open-Sora Plan v1.2版本引入新的3D全注意力架構,提升了對物理世界的理解能力。
本次更新主要亮點:
全新3D全注意力架構:新架構讓AI對物理世界的理解能力有了質的飛躍。不再是隻會平面思考的"二維碼",現在它能360度無死角理解這個立體世界啦!
文本生成視頻能力升級:你敲下一段文字,AI就能爲你呈現出栩栩如生的視頻畫面。
清晰度和一致性雙雙提升:通過新架構和優化的VAE結構,Open-Sora生成的視頻畫質更清晰,內容更連貫。告別模糊不清!
空間與時間的完美融合:新的3D全注意力架構解決了之前版本的一大難題——同時處理空間和時間維度。這意味着什麼?意味着生成的視頻在空間表現和時間流暢度上都將有顯著提升!
推理速度大幅提升:優化後的CausalVideoVAE結構不僅提高了模型的性能,還讓推理速度快得飛起。效率黨們歡呼吧!
回顧一下Open-Sora的發展歷程,我們會發現它的進步速度令人驚歎。就在2024年5月,v1.1.0版本還在使用2+1D模型架構,主要用於探索性訓練。而現在,短短几個月後,它就進化成了能創造3D世界的"造物主"!這速度,怕是連達爾文看了都要驚呼:"進化論要改寫啦!"
最帥的是,Open-Sora團隊不藏私!代碼、數據、模型統統開源,就差把"如何創造世界"的說明書貼你臉上了。他們的目標很簡單:讓每個人都能成爲視頻創作的"上帝"!這種開放共享的態度,無疑會加速AI視頻生成技術的進步。
Open-Sora Plan v1.2.0的發佈標誌着視頻生成模型邁入了一個新的時代。它不僅在視覺表示壓縮和推理效率上有了顯著提升,更爲未來的發展指明瞭方向。
項目地址:https://top.aibase.com/tool/open-sora-plan-v1-2