可靈收費了不要緊,又一款免費視頻生成工具來了。之前,備受關注的生數科技視頻生成模型Vidu現在已經正式在全球上線了。用戶直接用郵箱註冊登錄即可使用,無需排隊等待審覈。註冊成功後,用戶就能獲得80積分。
這款AI視頻生成器不僅功能全面,而且操作簡便,用戶可以輕鬆生成4秒或8秒的高清視頻,分辨率高達1080P,滿足各種高標準的視頻製作需求。
Vidu的核心亮點:
快速生成:Vidu實現了業界最快的推理速度,僅需30秒就能生成一段4秒鏡頭的視頻,速度是業內最快水平的兩倍。
高逼真度:無論是動漫風格還是寫實風格,Vidu都能生成生動逼真的畫面,人物動作自然流暢,大幅度動作也不會導致畫面崩壞。
角色一致性:Vidu支持角色一致性功能,上傳一個角色圖像後,可以指定該角色在任意場景中做出任意動作,創作梗圖、表情包變得輕而易舉。
多風格支持:除了寫實風格,Vidu還支持動漫風格視頻生成,畫風有宮崎駿的味道,想象力豐富。
文本到視頻的直接轉換:由於底層架構的創新,Vidu的作品感官上更加一鏡到底,視頻從頭到尾連續生成,沒有插幀痕跡。
廣泛的應用場景:從遊戲製作、影視後期到教育、培訓等,Vidu都能提供強大的支持。
相較於可靈、luma等產品,Vidu的主要特色在於它引入了角色一致性和動漫風格兩大特色功能。
這裏AIbase直接拿之前生成的平面插圖來測試,這類圖片在可靈等平臺生成視頻困難,人臉很容易崩。
Vidu的操作界面很簡單,只要上傳圖片,然後選擇圖片用途即可,這裏我沒有打算變化圖片原有背景,選擇用作起始幀,然後點擊生成即可。

提示詞:小男孩在水坑裏歡快的踩水,雨越下越大
測試效果如下:
可以看到,Vidu在動漫風格視頻生成這塊相對要比可靈那些強,人物運動正常且人物基本沒有崩。除了最後那一幀有點脫離提示詞外,前面部分基本可用。
爲了驗證Vidu在動漫這塊有多強,AIbase還拿出了”祖傳難題“,動漫古風人物來進行測試。昨天剛用這張圖片測試過可靈、luma,生成的效果都不太滿意。古風動漫人物一直都是視頻生成模型不太擅長的一塊。

提示詞:男孩伸手扶了一下帽子,突然笑起來
測試效果如下:
可以看到,古風人物動起來的過程整體還算連貫,而且手和臉部沒怎麼崩,不過人物還是稍微有變醜,相比可靈來說,算是對古風插畫這類的圖轉視頻保持較好的了。
3D模型類型的圖片,Vidu也可以輕鬆駕馭:
提示詞:可愛的機器小龍在玩泡泡
這種手繪畫風的動漫人物,Vidu也完全沒問題:
提示詞:情侶、親吻
人物一致性測試:
這裏AIbase選擇一張之前生成的鬱金香美女作爲測試圖:

生成效果如下:
提示詞:女孩穿着宋制漢服,走在江南小巷中
AIbase測試了幾個視頻,目前來看,Vidu在角色一致性方面的表現比較不穩定,生成的視頻較模糊,而且人物有時候容易崩。
值得注意的是,Vidu不像可靈一樣,支持多個任務同時進行。如果你上一個視頻還沒完成的話,下一個視頻生成任務是無法啓動的。

雖然官方宣傳Vidu僅需30秒就能生成一段4秒鏡頭,但AIbase實際測試中一個視頻生成的時間也是至少需要2、3分鐘的。但相對可靈、luma等還是要明顯快一些。
感興趣的可以自行嘗試,產品地址:https://top.aibase.com/tool/viduguanwang
Vidu是由清華朱軍教授領銜的團隊研發,基於完全自研的U-ViT架構,這一架構是全球首個將Diffusion和Transformer融合的架構,比Sora採用的DiT架構更早提出。
Vidu的創新之處在於其能夠實現文本到視頻的直接且連續的轉換,避免了傳統多步驟處理中的插幀和拼接,使得生成的視頻更加流暢,感官上更加自然。
生數科技成立於2023年3月,生數科技的團隊由來自清華大學人工智能研究院的核心成員組成,他們在多模態通用大模型的研發上具有深厚的背景和實力。公司自2023年成立以來,已經獲得了包括螞蟻集團、啓明創投等知名產業機構的認可,並完成了數億元的融資,成爲國內多模態大模型賽道估值最高的創業團隊。
