愛詩科技近日發佈了其視頻生成產品PixVerse V2,這是一個基於AI視頻大模型的創新工具,旨在幫助用戶釋放創意潛力。PixVerse V2採用了Diffusion+Transformer(DiT)基礎架構,並在多個方面進行了技術創新,使得視頻生成更加流暢、一致和有趣。
主要特點包括:
時空注意力機制:PixVerse V2引入了自研的時空注意力機制,提升了對空間和時間的感知能力,特別是在處理複雜場景時表現更爲出色。
文本理解能力:通過多模態模型,PixVerse V2能夠更精準地對齊文本信息和視頻信息,增強了模型的理解和表達能力。
優化的模型訓練:在傳統flow模型的基礎上,PixVerse V2通過加權損失促進了模型更快更優的收斂,提升了整體訓練效率。
視頻生成能力:PixVerse V2支持一次生成多個視頻片段,單片段可達到8秒,多片段可達到40秒,同時保持片段間的一致性。
用戶友好的功能:PixVerse V2支持一鍵生成1-5段連續視頻內容,且片段之間保持主體形象、畫面風格和場景元素的一致。此外,用戶還可以對生成結果進行二次編輯,靈活替換調整視頻內容。
愛詩科技團隊計劃在未來3個月內進行多次迭代升級,以提供更好的AI視頻生成體驗。PixVerse V2的目標是讓AI視頻創作變得更加便捷和高效,無論是記錄日常生活還是講述視頻故事,都能輕鬆實現。