快手旗下Kling AI于Omni生态周首日发布2.6版本,首次内置音频生成,支持中英双语对白、歌唱与音效同步输出,实现“文本⇄视频⇄音频”一键闭环。官方口号“See the Sound, Hear the Visual”直指其多模态同步定位。
技术规格方面,2.6保持10秒1080P高清输出,每5秒仅需25积分(较前版降30%)。扩散变换器+3D时空联合注意力架构带来三项提升:复杂指令遵守率提高15%、跨镜头角色一致性达SOTA、对标Seedance1.0盲测胜率285%。
市场层面,Kling2.6将率先在Artlist等专业平台上线,提供场景扩展与多元素编辑API,面向影视、短剧、广告及MV制作。快手表示,2026Q1将推出4K/60fps版本,并开放自定义声线库,继续降低“AI制片”门槛。
行业观察认为,音频同步补齐了AI视频最后一块短板,后期剪辑流程有望缩短50%以上。随着Kling2.6落地,AI创作工具竞争从“画面”延伸至“声音”,有声短视频或迎来新一轮供给爆发。
