騰訊AI團隊推出了一款令人振奮的AI唱歌模型LeVo,以其強大的音色克隆、分軌生成和高保真音樂表現引發業界熱議。據悉,LeVo在多項關鍵指標上可媲美行業領先的Suno4.5,爲中國AI音樂生成技術贏得一席之地。AIbase整理最新信息,爲您深度解析LeVo的突破性功能與潛力。
媲美Suno4.5:LeVo的硬核實力
LeVo由騰訊AI實驗室研發,採用語言模型(LM)架構,結合LeLM和音樂編解碼器,能夠並行生成混合音軌(融合人聲與伴奏)或雙軌音軌(人聲與伴奏分開)。在音樂性、音質、人聲與伴奏和諧度以及歌詞對齊等維度上,LeVo全面超越現有開源學術模型。根據最新評測,LeVo在歌詞對齊能力(LYC)上比Suno4.5高出0.21分,展現出卓越的文本控制能力。
項目地址:https://levo-demo.github.io/
零樣本音色克隆:個性化音樂創作新高度
LeVo支持零樣本音色克隆(Zero-Shot Voice Cloning),僅需3秒音頻片段即可精準複製目標音色,包括音調、情感和韻律。這一功能無需大量訓練數據,極大降低了音樂創作的技術門檻。無論是爲個人定製專屬音色,還是模仿知名歌手風格,LeVo都能提供自然流暢的生成效果,賦予創作者無限可能。
分軌生成:專業音樂製作的利器
與傳統AI音樂生成模型不同,LeVo支持雙軌生成模式,可分別生成人聲和伴奏音軌,爲後期混音和編輯提供了更大靈活性。這一功能尤其適合專業音樂製作人,能夠輕鬆實現高質量的分軌輸出,優化創作流程。相比之下,Suno4.5在音色克隆和分軌支持上略顯不足,LeVo的這一特性無疑爲行業樹立了新標杆。
高保真與多場景應用
LeVo在音質表現上接近Suno4.5的行業標準,尤其在音樂性、人聲與伴奏和諧度和音質(MOS評分)等方面表現出色。儘管在歌曲結構清晰度上略遜於Suno4.5和Mureka-O1,但LeVo通過多偏好對齊方法優化了生成結果,確保音樂在各種風格和場景下都能保持高保真效果。無論是流行音樂、影視配樂還是廣告製作,LeVo都能提供專業級輸出。
開源承諾:推動AI音樂生態發展
騰訊表示,LeVo將以開源形式發佈,計劃提供完整代碼和預訓練模型,供全球開發者免費使用。這一舉措不僅體現了騰訊在AI音樂領域的雄心,也爲全球音樂創作社區注入了新的活力。AIbase注意到,LeVo的開源策略將有效降低創作門檻,助力內容創作者和音樂愛好者實現創意表達。
騰訊LeVo的發佈標誌着中國AI音樂生成技術邁向全球前沿,其零樣本音色克隆和分軌生成功能爲音樂創作帶來了革命性突破。儘管在部分指標上與Suno4.5仍有差距,但LeVo憑藉高性價比和開源優勢,已成爲AI音樂領域的強有力競爭者。AIbase認爲,LeVo的推出不僅提升了中國AI技術的國際影響力,也爲音樂創作的民主化進程邁出了重要一步。