騰訊 AI Lab 正式推出並開源了一款名爲 SongGeneration 的音樂生成大模型。這一模型旨在解決音樂生成領域中普遍存在的音質、音樂性和生成速度等三大難題。SongGeneration 採用了一種基於大型模型的融合架構,顯著提升了音樂生成的音質表現,同時保持了較快的生成速度,甚至在部分方面超越了商業閉源模型的表現。

SongGeneration 不僅在音質和生成速度上有所突破,還具備多種功能,如文本控制、多軌合成和風格跟隨,極大增強了用戶的創作體驗。用戶只需輸入關鍵詞,即可生成符合特定風格和情緒的完整音樂作品。此外,用戶可以上傳參考音頻,SongGeneration 會生成風格一致的新曲,涵蓋多種流派,包括流行、搖滾等。

image.png

在技術方面,SongGeneration 構建了一套完整的數據管線,包括音伴分離、結構分析和歌詞識別等模塊,能夠高效處理音頻數據。其訓練模型總參數量約爲3B,經過海量中英文歌曲的預訓練,確保了其強大的生成能力。

SongGeneration 的推出不僅代表了音樂生成技術的進步,也積極響應了 “人人皆可創作” 的音樂未來願景。它爲內容創作者、遊戲開發者和音樂人提供了強大的工具,構建了開放、靈活的音樂 AI 生態系統,讓更多人能夠輕鬆參與音樂創作。

SongGeneration 模型體驗地址:https://huggingface.co/spaces/tencent/SongGeneration 

劃重點:  

🎵 SongGeneration 是騰訊 AI Lab 推出的開源音樂生成大模型,旨在提升音質、音樂性和生成速度。  

🎤 用戶可以通過輸入關鍵詞或上傳音頻輕鬆生成符合風格的新音樂,體驗直觀和高度可控的創作過程。  

🎶 該模型基於3B 參數的大型架構,經過大量中英文歌曲的預訓練,推動了音樂創作的智能化進程。