Kling 2.6將發佈：原生音頻+10秒1080P，AI視頻進入有聲時代

快手旗下Kling AI於Omni生態周首日發佈2.6版本，首次內置音頻生成，支持中英雙語對白、歌唱與音效同步輸出，實現“文本⇄視頻⇄音頻”一鍵閉環。官方口號“See the Sound， Hear the Visual”直指其多模態同步定位。

技術規格方面，2.6保持10秒1080P高清輸出，每5秒僅需25積分（較前版降30%）。擴散變換器+3D時空聯合注意力架構帶來三項提升:複雜指令遵守率提高15%、跨鏡頭角色一致性達SOTA、對標Seedance1.0盲測勝率285%。

市場層面，Kling2.6將率先在Artlist等專業平臺上線，提供場景擴展與多元素編輯API，面向影視、短劇、廣告及MV製作。快手錶示，2026Q1將推出4K/60fps版本，並開放自定義聲線庫，繼續降低“AI製片”門檻。

行業觀察認爲，音頻同步補齊了AI視頻最後一塊短板，後期剪輯流程有望縮短50%以上。隨着Kling2.6落地，AI創作工具競爭從“畫面”延伸至“聲音”，有聲短視頻或迎來新一輪供給爆發。

官宣！可靈 AI 安卓應用正式上線

日前，可靈 AI 官方宣佈，備受期待的安卓應用終於上線。這款應用將用戶所喜愛的 Kling AI 功能集中於一處，用戶只需輕輕點擊，即可體驗豐富多樣的功能，包括 Frames、Elements 等。根據官方頁面介紹，KLING AI 的核心功能包括 AI 視頻生成和 AI 圖像生成。用戶可以輸入文本提示或上傳參考圖像，輕鬆製作出分辨率高達1080P 的視頻。這款應用支持用戶生成長達3分鐘的創意視頻，方便用戶將想法轉化爲生動的影像。此外，用戶也可以利用文本或圖像生成多種風格和尺寸的創意圖像，並能夠一鍵將

英偉達出品！AI音頻模型Fugatto：輸入文本、音頻可生成音樂、音效

在音樂和聲音創作領域，技術與創意的結合總是面臨諸多挑戰。現有的 AI 模型往往只擅長特定的任務，缺乏廣泛的適應性，這使得 AI 在音樂製作中的輔助作用受限。爲了讓 AI 更好地服務於音樂與音頻生產，亟需一款能夠靈活應對各種創作需求的通用模型。爲此，NVIDIA 推出了 Fugatto，這是一款擁有25億參數的音頻生成與處理模型。Fugatto 的設計旨在通過結合文本提示與先進的音頻合成能力，提供高靈活度的聲音輸入和創作實驗空間。例如，它可以將鋼琴旋律轉變爲人聲演唱，或者讓小號發出

可口可樂用 AI 重製經典廣告，網友們卻說 “太假”！

可口可樂公司近期宣佈，利用人工智能技術重製了1995年經典的 “節日來臨”（Holidays Are Coming）廣告。這項大膽的嘗試讓可口可樂成爲首批完全通過 AI 製作電視廣告的大型公司之一。爲了實現這一目標，他們與三家 AI 工作室合作，分別製作了不同版本的廣告，這些廣告將通過電視、流媒體平臺以及全球數字視頻進行播出。視頻截圖根據可口可樂全球生成 AI 副總裁 Pratik Thakar 的介紹，這次製作主要採用了 Leonardo、Luma 和 Runway 等 AI 模型。Secret Level 的創始人 Jason Zada 表示，在製作過程中，他

Kling 2.6將發佈：原生音頻+10秒1080P，AI視頻進入有聲時代

相關推薦

快手 Kling Omni 本週即將發佈：實現“導演級”精準控制，可生成2分鐘帶原生音頻的長視頻

谷歌發佈Veo 3.1視頻生成模型：新增音頻功能和精細化編輯能力

官宣！可靈 AI 安卓應用正式上線

英偉達出品！AI音頻模型Fugatto：輸入文本、音頻可生成音樂、音效

可口可樂用 AI 重製經典廣告，網友們卻說 “太假”！