騰訊LeVo來襲！媲美Suno 4.5的AI唱歌模型，支持零樣本音色克隆

騰訊AI團隊推出了一款令人振奮的AI唱歌模型LeVo，以其強大的音色克隆、分軌生成和高保真音樂表現引發業界熱議。據悉，LeVo在多項關鍵指標上可媲美行業領先的Suno4.5，爲中國AI音樂生成技術贏得一席之地。AIbase整理最新信息，爲您深度解析LeVo的突破性功能與潛力。

媲美Suno4.5:LeVo的硬核實力

LeVo由騰訊AI實驗室研發，採用語言模型（LM）架構，結合LeLM和音樂編解碼器，能夠並行生成混合音軌(融合人聲與伴奏)或雙軌音軌(人聲與伴奏分開)。在音樂性、音質、人聲與伴奏和諧度以及歌詞對齊等維度上，LeVo全面超越現有開源學術模型。根據最新評測，LeVo在歌詞對齊能力(LYC)上比Suno4.5高出0.21分，展現出卓越的文本控制能力。

項目地址：https://levo-demo.github.io/

零樣本音色克隆:個性化音樂創作新高度

LeVo支持零樣本音色克隆（Zero-Shot Voice Cloning），僅需3秒音頻片段即可精準複製目標音色，包括音調、情感和韻律。這一功能無需大量訓練數據，極大降低了音樂創作的技術門檻。無論是爲個人定製專屬音色，還是模仿知名歌手風格，LeVo都能提供自然流暢的生成效果，賦予創作者無限可能。

分軌生成:專業音樂製作的利器

與傳統AI音樂生成模型不同，LeVo支持雙軌生成模式，可分別生成人聲和伴奏音軌，爲後期混音和編輯提供了更大靈活性。這一功能尤其適合專業音樂製作人，能夠輕鬆實現高質量的分軌輸出，優化創作流程。相比之下，Suno4.5在音色克隆和分軌支持上略顯不足，LeVo的這一特性無疑爲行業樹立了新標杆。

高保真與多場景應用

LeVo在音質表現上接近Suno4.5的行業標準，尤其在音樂性、人聲與伴奏和諧度和音質（MOS評分）等方面表現出色。儘管在歌曲結構清晰度上略遜於Suno4.5和Mureka-O1，但LeVo通過多偏好對齊方法優化了生成結果，確保音樂在各種風格和場景下都能保持高保真效果。無論是流行音樂、影視配樂還是廣告製作，LeVo都能提供專業級輸出。

開源承諾:推動AI音樂生態發展

騰訊表示，LeVo將以開源形式發佈，計劃提供完整代碼和預訓練模型，供全球開發者免費使用。這一舉措不僅體現了騰訊在AI音樂領域的雄心，也爲全球音樂創作社區注入了新的活力。AIbase注意到，LeVo的開源策略將有效降低創作門檻，助力內容創作者和音樂愛好者實現創意表達。

騰訊LeVo的發佈標誌着中國AI音樂生成技術邁向全球前沿，其零樣本音色克隆和分軌生成功能爲音樂創作帶來了革命性突破。儘管在部分指標上與Suno4.5仍有差距，但LeVo憑藉高性價比和開源優勢，已成爲AI音樂領域的強有力競爭者。AIbase認爲，LeVo的推出不僅提升了中國AI技術的國際影響力，也爲音樂創作的民主化進程邁出了重要一步。

前谷歌 CEO 投資的初創公司發佈240億參數化學推理模型，準確率超越多種領先模型

在人工智能領域，大模型的研究不斷進展，尤其是在推理能力的提升上。最近，由前谷歌 CEO 埃裏克・施密特投資的初創公司 FutureHouse，開源了一個名爲 ether0的化學任務推理模型，參數規模高達240億。這一模型在不需要額外領域預訓練的情況下，通過後訓練技術，展現出強大的化學領域能力，尤其是在數據需求上相比於傳統領域專用模型顯著減少。推理模型的應用不僅限於簡單的選擇題測試，FutureHouse 團隊希望通過 ether0改變這種現狀，推動科學推理的深入研究。爲了構建該模型，研究團隊

月之暗面發佈全新開源模型 Kimi-Dev-72B，打破編程基準記錄

月之暗面（Moonshot AI）宣佈推出其新開源模型 Kimi-Dev-72B，這一模型專注於軟件工程任務，並在 AI 編程基準測試 SWE-bench Verified 中創下了全球最高的開源模型成績。Kimi-Dev-72B 以僅72億參數量的設計，成功超越了剛發佈不久的 DeepSeek-R1，後者的參數量高達671億。在 SWE-bench Verified 測試中，Kimi-Dev-72B 獲得了60.4% 的高分，成爲當前開源模型中的新標杆。該模型的優化過程包括大規模強化學習，使其能夠自動修復 Docker 環境中的真實存儲庫。Kimi-Dev-72B 在測試中僅在所有測試用例通過後才能獲得獎勵，

夸克App推出“夸克老師” 具備個性化AI輔導能力

今日，夸克App正式推出全新升級的學習產品——“夸克老師”，這一AI家教的亮相，爲學習領域帶來了新的活力。 “夸克老師”功能強大，集講題、批作業、出題、找試卷等多種能力於一身，堪稱學生身邊的得力學習助手。其背後依託夸克靈知學習大模型，並以通義千問爲基礎，在解答數學、物理等高難度題目時，展現出強大的推理及講解能力。此前在多家媒體組織的高考數學題測評中，夸克憑藉出色表現分別取得145分和146分的成績，位列榜首，這也從側面印證了“夸克老師”在解題方面的實力。

MagicTryOn發佈！浙大x vivo聯手打造視頻虛擬試衣，跳舞也能完美換裝！

浙江大學聯合vivo推出了一款革命性的視頻虛擬試衣模型MagicTryOn，以其卓越的時空一致性、服裝細節保真度和泛化能力引發業界熱議。這一創新技術不僅支持圖像和視頻試穿，還能在複雜場景和大幅度運動中實現逼真的服裝效果，爲電商、時尚和虛擬內容創作開闢了全新可能。全球首創:基於擴散Transformer的視頻試穿框架MagicTryOn摒棄了傳統的U-Net架構，採用先進的擴散Transformer（DiT）技術，顯著提升了模型的表達能力。結合全自注意力機制，該框架實現了視頻在時間和空間維度上的聯合建模，

POE平臺上線即夢3.0圖像與Seedance1.0Lite視頻模型

近日，全球知名AI模型整合平臺POE正式上線字節跳動旗下即夢3.0圖像模型與Seedance1.0Lite視頻模型，標誌着字節在海外AI市場的進一步發力。據瞭解，即夢3.0圖像模型在中文直出方面取得突破，顯著提升了大字準確性、設計感和豐富度，支持2K高清圖像生成，可呈現寫實、卡通等多種風格，適用於複雜場景與藝術字體創作。該模型通過創新的“缺陷感知訓練範式”，優化圖像質量，確保無水印輸出，廣泛應用於設計、廣告等領域。Seedance1.0Lite視頻模型支持文生視頻與圖生視頻，生成時長可選5秒

騰訊LeVo來襲！媲美Suno 4.5的AI唱歌模型，支持零樣本音色克隆

相關推薦

​前谷歌 CEO 投資的初創公司發佈240億參數化學推理模型，準確率超越多種領先模型

​月之暗面發佈全新開源模型 Kimi-Dev-72B，打破編程基準記錄

夸克App推出“夸克老師” 具備個性化AI輔導能力

MagicTryOn發佈！浙大x vivo聯手打造視頻虛擬試衣，跳舞也能完美換裝！

POE平臺上線即夢3.0圖像與Seedance1.0Lite視頻模型

前谷歌 CEO 投資的初創公司發佈240億參數化學推理模型，準確率超越多種領先模型

月之暗面發佈全新開源模型 Kimi-Dev-72B，打破編程基準記錄