站長之家(ChinaZ.com) 6月18日 消息:Runway最近推出了新一代視頻生成模型Gen-3Alpha,這一模型在保真度、一致性和動作表現方面都有重大改進,爲構建通用世界模型邁出了重要一步。Gen-3Alpha具備多項顯著的功能和特點,使其成爲創意產業中的新星。
視頻來自Runway
以下是 Gen3模型的一些關鍵特點:
重大改進:Gen-3Alpha 是 Runway 在爲大規模多模態訓練構建的新基礎設施上訓練的一系列模型中的第一個。與 Gen-2相比,它在保真度、一致性和動作方面有了顯著提升。
聯合訓練:Gen-3Alpha 經過視頻和圖像的聯合訓練,將爲 Runway 的文本轉視頻、圖像轉視頻和文本轉圖像工具提供動力。
控制模式:現有的控制模式包括 Motion Brush、高級攝像頭控制、導演模式,以及即將推出的工具,用於更精細地控制結構、風格和動作。
極度穩定的光影:Gen3模型能夠生成具有豐富變化且極其穩定的光影效果,即便在高速移動的場景中也能保持高質量輸出。
快速生成:Gen3模型的生成速度非常快,5秒視頻的生成時間爲45秒,10秒視頻的生成時間爲90秒,這在當前市場上的 AI 視頻生成速度中具有明顯優勢。
審美強:Runway 以其一貫的審美優勢,提供了配色和風格上令人滿意的視頻內容,與一些其他 AI 視頻產品相比,其視覺效果更加吸引。
想象力:Gen3模型在處理幻想、玄幻、科幻、魔幻等場景時,展現出了強大的想象力和創作潛力。
物理規律:Gen3在物理規律的表現上達到了行業領先水平,能夠生成符合現實物理規律的視頻內容。
Gen-3Alpha在一個全新的大規模多模態訓練基礎設施上進行訓練,能夠處理和融合文本、圖像和視頻等不同類型的數據,生成高質量的多模態輸出。這種聯合訓練方法提高了模型在生成動態和靜態內容的表現能力。
視頻來自Runway
Gen-3Alpha支持多種生成工具,包括從文本到視頻(Text to Video)、從圖像到視頻(Image to Video)、從文本到圖像(Text to Image)的轉換工具。這些工具爲創作者提供了豐富的創作選擇,以滿足不同的創作需求。
視頻來自Runway
在時間控制方面,Gen-3Alpha通過使用時間密集型的字幕進行訓練,增強了模型對場景細節和時間變化的理解。這使得它能夠生成具有創意過渡和精確關鍵幀控制的視頻內容,實現對生成內容的精確關鍵幀設置和場景過渡。
視頻來自Runway
Prompt:在日本城市以超高速移動的火車窗戶上,一個女人的微妙倒影。
從上面這個視頻可以看到,Gen-3Alpha在光影上的表現可圈可點,在高速火車上極速變換的夜景燈光效果十分穩定,可以說是相當驚豔了。
Gen-3Alpha還能夠生成表達豐富、逼真的人類角色,提供廣泛的動作、手勢和情緒,爲敘事創作提供了新的機會。這一點在提高視頻質量和敘事機會方面尤爲重要。
高級控制模式的支持也是Gen-3Alpha的一大亮點。它支持運動畫筆(Motion Brush)、先進攝像頭控制(Advanced Camera Controls)和導演模式(Director Mode),爲創作者提供了更大的創作自由和控制力度。
視頻來自Runway
在性能方面,Gen-3Alpha採用分佈式計算和高效存儲架構,確保處理大規模數據時的性能和速度,支持快速訓練和生成,滿足高效創作的需求。
Runway還引入了新的安全措施,以確保生成內容的安全和可靠性,並與多家頂級娛樂和媒體公司合作進行定製開發。這標誌着視頻生成技術的又一大步,爲創意產業帶來了新的可能性。
官網地址:https://top.aibase.com/tool/gen-3-alpha
