最近,又有一款名爲Hotshot 的全新的文本轉視頻 AI 生成器讓人眼前一亮,從官方曬出的視頻效果,相當驚豔!

微信截圖_20240821101958.png

可以先感受下生成的效果:

據瞭解,這款新的 Hotshot 模型最長能夠生成長達10秒、720p 的視頻,並且在創作風格上非常靈活,可以展現不同的動畫風格,比如像漫畫書一樣的動畫或是轉描風格的視頻。其亮點可總結如下:

文本轉視頻生成 :用戶可以輸入文本,生成可達10秒的720p 視頻,支持快速和便捷的創作過程。

無水印視頻輸出 :免費用戶生成的視頻沒有水印,這爲創作者提供了更多自由度。

多樣化視頻風格 :Hotshot 可以生成多種風格的視頻,包括漫畫風格和動態影像,滿足不同創作需求。

高適應性與擴展性 :該模型具備擴展至更長視頻時長和更高分辨率的潛力,未來還可能支持音頻生成。

 強大的技術基礎 :Hotshot 基於600百萬視頻片段進行訓練,使用了大量 GPU,實現了高效的視頻生成。

該AI視頻生成模型目前已經進入了公開的 “早期預覽” 階段,用戶可以在 Hotshot 的官方網站上免費體驗這個模型,不過需要注意的是,每天的生成次數被限制在兩個視頻,且生成的視頻是沒有水印的。

 Hotshot 背後團隊四個月完成模型訓練

 Hotshot 的初創公司於2023年成立,由 Aakash Sastry、John Mullan 和 Duncan Crawbuck 三位創始人共同打造。

Sastry 在社交媒體 X 上表示:“在過去的十年裏,首次有可能爲客戶構建強大而新穎的視頻應用。” 這款新的 Hotshot 模型是他們實現這一目標的基礎,他們表示這是一個開始,未來將有更多驚喜呈現給大家。之前,Hotshot 以一款免費的消費者 AI 照片創建和編輯應用走紅,但現在他們將重心轉向了這一新的文本轉視頻 AI 模型。

據 Sastry 透露,Hotshot 團隊在短短四個月內就完成了這個模型的訓練,這可不是一件簡單的事!他們使用了6億個視頻片段,依靠數千個 GPU 進行訓練,過程中的技術挑戰可想而知,甚至有時候機器的故障讓人頭疼不已。

爲了保證模型的順利訓練,他們的團隊成員幾乎全天候監控着訓練進程。Sastry 也表示,他們正在探索更長的視頻時長和更高的分辨率,未來或許還會加入音頻元素。

在他看來,AI 生成內容可能會在未來12個月內成爲數字媒體的主流,尤其是在 YouTube 視頻製作方面,創作者將能夠完全控制生成過程,從文本到視頻,甚至音頻。

AIbase團隊也測試了 Hotshot,發現其生成的視頻有一定的潛力,儘管目前在質量和細節上可能不如一些競爭對手。比如輸入提示詞“An ice sculptor carving an intricate design, chips flying as they work”,生成視頻效果如下:

視頻動作相對流暢,不過清晰度卻有待提高。如果你也想嘗試玩玩,可以訪問以下入口:

產品入口:https://top.aibase.com/tool/hotshot

劃重點:

🌟 Hotshot 推出的新文本轉視頻 AI 生成器,已進入公開 “早期預覽” 階段,用戶可免費體驗。

🚀 該模型在短短四個月內使用6億個視頻片段和數千個 GPU 進行訓練,展現出強大潛力。

🎥 創始人 Sastry 預測,未來一年內,AI 生成的完整 YouTube 視頻將會普及,創作者將擁有更多控制權。