近日,通義實驗室正式開源了其創新性的音樂生成技術——InspireMusic。該技術旨在打造一個集音樂、歌曲及音頻生成能力於一體的開源AIGC工具包,爲研究者、開發者及音樂愛好者提供一個全面的創作平臺。
InspireMusic不僅爲研究者和開發者提供了豐富的音樂/歌曲/音頻生成模型的訓練和調優工具,還爲他們配備了高效的模型,以便優化生成效果。同時,這款工具包也大大降低了音樂創作的門檻,使得音樂愛好者能夠通過簡單的文字描述或音頻提示,輕鬆生成多樣化的音樂作品。
InspireMusic的文生音樂創作模式尤爲引人注目。它涵蓋了多種曲風、情感表達和複雜的音樂結構控制,爲用戶提供了極大的創作自由度和靈活性。用戶可以根據個人喜好,通過輸入文本描述來生成符合自己需求的音樂作品,無論是放鬆的爵士樂,還是充滿童趣的旋律,InspireMusic都能一一呈現。
此外,InspireMusic還具備靈活的推理模式設計,包括fast模型和高音質模型,以滿足不同用戶的需求。無論是追求快速生成還是高音質輸出的用戶,都能在這款工具包中找到適合自己的創作方式。
目前,InspireMusic已開源了音樂生成的訓練和推理代碼,用戶可以通過GitHub倉庫、ModelScope創空間以及HuggingFace Spaces等平臺進行訪問和使用。
未來,通義實驗室計劃進一步開放InspireMusic的歌唱生成和音頻生成基礎模型,以吸引更多的研究者、開發者及用戶積極參與體驗和研發。相信在大家的共同努力下,InspireMusic將不斷完善,爲音樂創作領域帶來更多驚喜。
GitHub 倉庫:InspireMusic(https://github.com/FunAudioLLM/InspireMusic)
Online Demo:
ModelScope創空間:https://modelscope.cn/studios/iic/InspireMusic/summary
HuggingFace Spaces:https://huggingface.co/spaces/FunAudioLLM/InspireMusic