今日,北京生數科技宣佈AI視頻生成模型 Vidu 官網全球上線。Vidu 是一個利用人工智能技術,通過文本或圖片生成視頻的模型。
今年4月,生數科技與清華大學聯合發佈了中國首個視頻大模型——"Vidu",這標誌着中國在視頻生成技術方面邁出了重要一步。
"Vidu"採用了團隊原創的U-ViT架構,該架構融合了Diffusion和Transformer技術。這一創新的視頻大模型能夠快速生成長達16秒、1080P高清視頻,同時在模擬真實物理世界的基礎上,展現出極高的想象力和創造力。其多鏡頭生成能力和時空一致性是"Vidu"的顯著特點。
自發布以來,"Vidu"在全球範圍內取得了顯著的突破,其性能已經達到了國際頂尖水平,並仍在不斷地迭代和優化。這一成就得益於團隊在貝葉斯機器學習和多模態大模型領域的深厚積累,以及多項原創性成果。
憑藉對U-ViT架構的深入理解和豐富的工程、數據經驗,團隊迅速攻克了長視頻表示與處理的關鍵技術難題,成功研發出了"Vidu"視頻大模型。"Vidu"在提升視頻連貫性和動態性方面取得了顯著成果,推動了視頻處理技術的發展。
體驗地址:https://www.vidu.studio/