Kling 2.6将发布：原生音频+10秒1080P，AI视频进入有声时代

快手旗下Kling AI于Omni生态周首日发布2.6版本，首次内置音频生成，支持中英双语对白、歌唱与音效同步输出，实现“文本⇄视频⇄音频”一键闭环。官方口号“See the Sound， Hear the Visual”直指其多模态同步定位。

技术规格方面，2.6保持10秒1080P高清输出，每5秒仅需25积分（较前版降30%）。扩散变换器+3D时空联合注意力架构带来三项提升:复杂指令遵守率提高15%、跨镜头角色一致性达SOTA、对标Seedance1.0盲测胜率285%。

市场层面，Kling2.6将率先在Artlist等专业平台上线，提供场景扩展与多元素编辑API，面向影视、短剧、广告及MV制作。快手表示，2026Q1将推出4K/60fps版本，并开放自定义声线库，继续降低“AI制片”门槛。

行业观察认为，音频同步补齐了AI视频最后一块短板，后期剪辑流程有望缩短50%以上。随着Kling2.6落地，AI创作工具竞争从“画面”延伸至“声音”，有声短视频或迎来新一轮供给爆发。

官宣！可灵 AI 安卓应用正式上线

日前，可灵 AI 官方宣布，备受期待的安卓应用终于上线。这款应用将用户所喜爱的 Kling AI 功能集中于一处，用户只需轻轻点击，即可体验丰富多样的功能，包括 Frames、Elements 等。根据官方页面介绍，KLING AI 的核心功能包括 AI 视频生成和 AI 图像生成。用户可以输入文本提示或上传参考图像，轻松制作出分辨率高达1080P 的视频。这款应用支持用户生成长达3分钟的创意视频，方便用户将想法转化为生动的影像。此外，用户也可以利用文本或图像生成多种风格和尺寸的创意图像，并能够一键将

英伟达出品！AI音频模型Fugatto：输入文本、音频可生成音乐、音效

在音乐和声音创作领域，技术与创意的结合总是面临诸多挑战。现有的 AI 模型往往只擅长特定的任务，缺乏广泛的适应性，这使得 AI 在音乐制作中的辅助作用受限。为了让 AI 更好地服务于音乐与音频生产，亟需一款能够灵活应对各种创作需求的通用模型。为此，NVIDIA 推出了 Fugatto，这是一款拥有25亿参数的音频生成与处理模型。Fugatto 的设计旨在通过结合文本提示与先进的音频合成能力，提供高灵活度的声音输入和创作实验空间。例如，它可以将钢琴旋律转变为人声演唱，或者让小号发出

可口可乐用 AI 重制经典广告，网友们却说 “太假”！

可口可乐公司近期宣布，利用人工智能技术重制了1995年经典的 “节日来临”（Holidays Are Coming）广告。这项大胆的尝试让可口可乐成为首批完全通过 AI 制作电视广告的大型公司之一。为了实现这一目标，他们与三家 AI 工作室合作，分别制作了不同版本的广告，这些广告将通过电视、流媒体平台以及全球数字视频进行播出。视频截图根据可口可乐全球生成 AI 副总裁 Pratik Thakar 的介绍，这次制作主要采用了 Leonardo、Luma 和 Runway 等 AI 模型。Secret Level 的创始人 Jason Zada 表示，在制作过程中，他

Kling 2.6将发布：原生音频+10秒1080P，AI视频进入有声时代

相关推荐

快手 Kling Omni 本周即将发布：实现“导演级”精准控制，可生成2分钟带原生音频的长视频

谷歌发布Veo 3.1视频生成模型：新增音频功能和精细化编辑能力

官宣！可灵 AI 安卓应用正式上线

英伟达出品！AI音频模型Fugatto：输入文本、音频可生成音乐、音效

可口可乐用 AI 重制经典广告，网友们却说 “太假”！