據《The Information》消息,人工智能巨頭OpenAI正在積極開發一款全新的生成音樂工具,該工具能夠根據用戶提供的文本描述或音頻提示來創作音樂。此舉標誌着OpenAI在文本和視頻模型(如ChatGPT和Sora)成功之後,進一步向多模態內容生成領域邁進。

功能聚焦:視頻配樂與精準伴奏
消息人士透露,這款新工具的潛在應用場景十分廣泛且實用,包括爲現有視頻添加定製化的背景音樂,以及根據現有的人聲軌道生成吉他等樂器伴奏。然而,目前OpenAI尚未明確該工具的發佈計劃——是作爲獨立產品推出,還是將功能集成到其現有的核心產品,如ChatGPT和視頻生成應用Sora中。
訓練數據揭祕:攜手茱莉亞學院
爲了確保新模型的訓練數據質量和專業性,一位消息人士指出,OpenAI正與著名的茱莉亞學院(Juilliard School)部分學生進行合作,對樂譜進行細緻的註釋工作,以此作爲高質量的訓練數據來源。
儘管OpenAI在ChatGPT問世之前曾發佈過生成音樂模型,但近期該公司一直專注於文本轉語音和語音轉文本的音頻模型開發。此次傳出進軍音樂生成的消息,意味着OpenAI將與該領域的先行者展開競爭,目前擁有生成音樂模型的其他主要公司包括科技巨頭谷歌和初創公司Suno等。
