快手旗下的可灵 AI 在官方公众号上宣布推出其首个 “音画同出” 模型,正式命名为可灵2.6。该模型的亮点在于其能够在一次生成过程中,同时产生画面、自然语音、音效和环境氛围,充分打通 “音” 和 “画” 两个世界,提升了用户的创作体验。

图片

可灵2.6提供了两条创作路径,分别是 “文生音画” 和 “图生音画”。“文生音画” 允许用户通过简单的一句话,快速生成一条完整的音视频内容。而 “图生音画” 则可以让静态画面 “开口说话” 并动态呈现。这意味着,用户只需提供文本或图像,就能轻松制作出丰富的音视频作品。

图片

该模型的应用场景非常广泛,适合多种形式的内容创作,包括单人独白(如商品展示、生活 Vlog、新闻播报、演讲表达)、旁白解说(如商品讲解、赛事解说、纪录片、故事叙述)、多人对白(如访谈节目、短剧等),以及音乐表演(如唱歌、说唱、多重合唱、乐器演奏)等。

可灵 AI 表示,2.6版本的推出将使得视频创作变得更加灵活与便捷,用户将能够更好地表达自己的创意和想法。此次模型的上线,标志着快手在 AI 创作领域又向前迈出了一步,进一步满足了用户日益增长的内容创作需求。

划重点:

🎨 可灵2.6模型实现音画同步生成,提升用户创作体验。

🖊️ 提供 “文生音画” 和 “图生音画” 两条创作路径,方便多种内容形式。

🎤 广泛适用于独白、旁白、对话和音乐表演等多种场景。