最近幾天,MiniMax發佈的海螺視頻生成模型 abab-video-1在海內外賺足了眼球。不僅國內網友玩的歡,國外網友對它的評價也頗高。

整體體驗下來,海螺視頻生成易用性強,只需要簡單輸入一句話就可以生成一段絲滑的視頻。視頻整體運動比較穩定,而且人物的動作十分自然。

X上這位名叫“Ryan Morrison”的博主直言海螺視頻是目前他見過的手部動作生成最自然的。

MiniMax1.jpg

還有博主用海螺視頻生成了“星球大戰”視頻,從畫面的色彩和美學上來看,已經有”好萊塢電影“那味兒了。而且運鏡整體也很流暢,動作幅度大,視頻也沒有崩。

MiniMax3.jpg

更有博主做了一個對比,直言海螺視頻在美學和視頻表現上超越可靈。事實真的是這樣嗎?

海螺視頻VS可靈實測效果對比

下面,AIbase搞了三組提示詞進行測試對比,一起來看看對比效果吧!

實測對比一:城市風景(複雜提示詞)

提示詞1:展現一座現代城市逐漸變回過去的樣子。摩天大樓慢慢消失,取而代之的是古老的建築;汽車變成馬車,街道上的人們衣着也回到了過去的風格。整個城市彷彿在時光機裏穿梭,帶觀衆體驗不同時代的風貌。

視頻由AIbase使用海螺AI生成

可以看到,海螺視頻對提示詞的理解還是比較到位的,視頻古今建築轉場漸變的過渡也還算自然。表現還是很不錯的。

同樣的提示詞,可靈生成的效果如下:

視頻由AIbase使用可靈生成

可靈文生視頻在複雜且較長提示詞的理解方面感覺有點欠缺,目前從視頻來看,只理解了前半部分,並沒有生成從現代建築到古老建築的轉變效果。如果用圖生視頻的話,可靈應該可以表現的更好。

實測對比二:酒吧裏的人(複雜提示詞)

提示詞2:5個人坐在酒吧的吧檯上,通過顏色變化展現5個人的情緒波動。畫面以人物肖像爲主,背景顏色隨着表情變化而改變。喜悅時明亮溫暖,悲傷時深沉冷調,憤怒時鮮豔激烈。顏色的流動展現情緒的微妙變化,讓觀衆直觀感受人物內心世界。

AIbase在提示詞2裏設置了好幾個複雜的細節,比如“情緒的變化”以及“背景色調跟隨情緒變化”這樣的描述,而且還增加了畫面的人數,難度升級。

視頻由AIbase使用海螺視頻生成

目前來看,海螺視頻貌似沒有被難住,人物情緒的轉換很自然,而且臉沒有崩,背景的色調也緊隨着情緒進行相應的變化,表現力很強。

視頻由AIbase使用可靈生成

同樣的提示詞,可靈生成的人物少了一個,而且臉部也崩了,色調也沒按照提示詞的要求做到跟隨情緒變化。

實測對比三:星空下的情侶(簡單提示詞)

可能是提示詞太長,且過於複雜了,換個簡單的提示詞試試~

提示詞3:一對情侶牽手,在繁星點點的夜空中漫步,背景中的星河在緩的移動

視頻由AIbase使用海螺視頻生成

海螺生成的視頻從運動幅度到構圖到美學角度都沒有毛病,情侶散步的動作也很自然

視頻由AIbase使用可靈生成

可靈生成的星空也沒有啥問題,唯一的小瑕疵就是下方的情侶在畫面中佔比有點小了,很容易被忽略,人物的外形也有一點崩,但還在可接受範圍

實測對比結果

從上面的幾個測試來看,至少在文生視頻這塊,海螺視頻確實是超越了可靈。目前可靈的優勢在於它的功能更豐富,還支持圖生視頻,首尾幀等,這塊表現會比文生視頻要強得多。由於海螺視頻只有文生視頻,圖生視頻這塊就無法做對比了。

總結起來,海螺視頻主要優點如下:

美學水平:海螺模型生成的視頻在畫面美感上有顯著提升,色彩搭配更加協調,構圖更加精美。

鏡頭運動:相比可靈,海螺模型在視頻的運鏡技巧上更勝一籌,能夠呈現出更加流暢自然的畫面轉換和鏡頭移動。

表情刻畫:海螺模型在人物表情的塑造上更加細膩豐富,能夠更好地傳達情感和故事。

文字呈現:在需要展示文字的場景中,海螺模型的表現更加出色,文字的佈局和設計更加美觀,易於閱讀。

視頻連貫性:海螺模型生成的視頻在情節發展和畫面轉換上更加連貫,storytelling能力更強。

創意空間:海螺模型爲創作者提供了更廣闊的創意發揮空間,能夠更好地實現獨特的視覺效果和敘事方式。

感興趣的可以自行嘗試:https://top.aibase.com/tool/hailuowenwen