快手旗下的可靈 AI 在官方公衆號上宣佈推出其首個 “音畫同出” 模型,正式命名爲可靈2.6。該模型的亮點在於其能夠在一次生成過程中,同時產生畫面、自然語音、音效和環境氛圍,充分打通 “音” 和 “畫” 兩個世界,提升了用戶的創作體驗。

可靈2.6提供了兩條創作路徑,分別是 “文生音畫” 和 “圖生音畫”。“文生音畫” 允許用戶通過簡單的一句話,快速生成一條完整的音視頻內容。而 “圖生音畫” 則可以讓靜態畫面 “開口說話” 並動態呈現。這意味着,用戶只需提供文本或圖像,就能輕鬆製作出豐富的音視頻作品。

該模型的應用場景非常廣泛,適合多種形式的內容創作,包括單人獨白(如商品展示、生活 Vlog、新聞播報、演講表達)、旁白解說(如商品講解、賽事解說、紀錄片、故事敘述)、多人對白(如訪談節目、短劇等),以及音樂表演(如唱歌、說唱、多重合唱、樂器演奏)等。
可靈 AI 表示,2.6版本的推出將使得視頻創作變得更加靈活與便捷,用戶將能夠更好地表達自己的創意和想法。此次模型的上線,標誌着快手在 AI 創作領域又向前邁出了一步,進一步滿足了用戶日益增長的內容創作需求。
劃重點:
🎨 可靈2.6模型實現音畫同步生成,提升用戶創作體驗。
🖊️ 提供 “文生音畫” 和 “圖生音畫” 兩條創作路徑,方便多種內容形式。
🎤 廣泛適用於獨白、旁白、對話和音樂表演等多種場景。
