震撼來襲！Open-Sora Plan v1.2發佈，清晰度、推理速度起飛

Open-Sora Plan又升級了!最新發布的Open-Sora Plan v1.2版本引入新的3D全注意力架構，提升了對物理世界的理解能力。

本次更新主要亮點:

全新3D全注意力架構:新架構讓AI對物理世界的理解能力有了質的飛躍。不再是隻會平面思考的"二維碼"，現在它能360度無死角理解這個立體世界啦!

文本生成視頻能力升級:你敲下一段文字，AI就能爲你呈現出栩栩如生的視頻畫面。

清晰度和一致性雙雙提升:通過新架構和優化的VAE結構，Open-Sora生成的視頻畫質更清晰，內容更連貫。告別模糊不清!

空間與時間的完美融合:新的3D全注意力架構解決了之前版本的一大難題——同時處理空間和時間維度。這意味着什麼?意味着生成的視頻在空間表現和時間流暢度上都將有顯著提升!

推理速度大幅提升:優化後的CausalVideoVAE結構不僅提高了模型的性能，還讓推理速度快得飛起。效率黨們歡呼吧!

回顧一下Open-Sora的發展歷程，我們會發現它的進步速度令人驚歎。就在2024年5月，v1.1.0版本還在使用2+1D模型架構，主要用於探索性訓練。而現在，短短几個月後，它就進化成了能創造3D世界的"造物主"!這速度，怕是連達爾文看了都要驚呼:"進化論要改寫啦!"

最帥的是，Open-Sora團隊不藏私!代碼、數據、模型統統開源，就差把"如何創造世界"的說明書貼你臉上了。他們的目標很簡單:讓每個人都能成爲視頻創作的"上帝"!這種開放共享的態度，無疑會加速AI視頻生成技術的進步。

Open-Sora Plan v1.2.0的發佈標誌着視頻生成模型邁入了一個新的時代。它不僅在視覺表示壓縮和推理效率上有了顯著提升，更爲未來的發展指明瞭方向。

項目地址：https://top.aibase.com/tool/open-sora-plan-v1-2

AI音樂生成工具Udio更新 V1.5 模型音質提升顯著

AI音樂生成工具Udio發佈了V1.5版本，音質顯著提升，關鍵音調控制功能的引入使得音樂創作更加精準。新模型支持多語言，擴大了受衆範圍。Udio還增強了產品功能，包括專屬創作頁面、音樂片段下載、音頻到音頻重混功能以及可分享的歌詞視頻，爲音樂創作提供了更多可能性。這次更新不僅提升了音樂質量，還豐富了用戶體驗，成爲音樂創作者的有力助手。

萬事達卡通過生成式 AI 將欺詐檢測率提高一倍

萬事達卡推出利用生成式人工智能與圖形技術的創新方法，顯著提升對被盜支付卡的識別率，使其檢測率增加一倍，能於卡片被惡意使用前即發現風險。此技術對在線和實體零售商均有深遠影響，有助於減少欺詐損失，提升交易安全性及客戶體驗。通過快速掃描大量卡數據和交易信息，系統能識別新欺詐模式，預測並推測出部分可見卡信息，推測完整卡信息，及時警告銀行，保護持卡人免受欺詐。該技術結合生成式AI與圖形技術，分析欺詐交易與可疑商家信息，快速阻止可疑卡片使用。面對在線欺詐的全球性挑戰，此係統有望減少406.2億美元的全球支付欺詐損失。

百度文心一言限量免費發放“會員體驗卡” 可免費體驗7次文心大模型4.0 Turbo

百度文心一言向用戶免費發放“會員體驗卡”，允許體驗其最新大模型4.0Turbo，限7次。領取有時間與次數限制，適用於已領取過其他體驗卡的用戶。該模型通過技術創新在速度和效果上顯著提升，融合數據、基礎模型、對齊技術等，與飛槳文心聯合優化，展現出接近通用人工智能的潛力。

雲計算公司Lambda推出按需獲取Nvidia H100 GPU的全新集羣服務

GPU雲計算公司Lambda推出1-Click集羣服務，允許用戶按需獲取Nvidia H100GPU和Quantum2InfiniBand集羣，特別適合短期需要GPU算力的公司。此創新服務簡化了硬件和軟件協調流程，無需長期合同，用戶只需在需要時預訂，最小預訂時間爲兩週。Lambda成立於2012年，近期融資3.2億美元，估值15億美元，顯示出市場對其服務的高需求。此服務針對那些正在建立自己模型、需要大量GPU算力但不需24小時全天候使用的公司，特別是小型AI企業，提供了一種靈活、成本效益高的解決方案。

震撼來襲！Open-Sora Plan v1.2發佈，清晰度、推理速度起飛

相關推薦

Gemini 現已登陸 X Google Gemini品牌罕見亮相

AI音樂生成工具Udio更新 V1.5 模型音質提升顯著

萬事達卡通過生成式 AI 將欺詐檢測率提高一倍

百度文心一言限量免費發放“會員體驗卡” 可免費體驗7次文心大模型4.0 Turbo

雲計算公司Lambda推出按需獲取Nvidia H100 GPU的全新集羣服務