谷歌DeepMind正式發佈了其最新音樂生成模型 Lyria2,標誌着人工智能在音樂創作領域的又一重大突破。作爲前代Lyria模型的升級版本,Lyria2以其高保真音質、實時交互功能和多風格適配性,爲音樂家、製作人和內容創作者提供了前所未有的創作工具。

image.png

高保真音質,捕捉音樂細微之美

Lyria2在音質表現上實現了顯著突破,能夠生成48kHz立體聲音頻,達到專業級水準。無論是古典音樂的優雅旋律,還是電子音樂的動態節奏,Lyria2都能精準捕捉不同樂器和演奏風格的細微差別。據谷歌DeepMind介紹,該模型通過先進的生成技術,結合自監督學習和自迴歸生成算法,確保音樂作品具有高度的真實感和表現力。

音樂家可以通過簡單的文本提示,例如“歡快的爵士鋼琴曲”或“史詩般的交響樂”,生成符合需求的音樂片段。這種高保真輸出不僅適合專業音樂製作,還能無縫集成到影視、廣告等商業項目中,顯著降低創作門檻和成本。

實時音樂生成,激發創作靈感

Lyria2引入了創新的 Lyria RealTime 功能,允許用戶實時操控音樂的生成過程。創作者可以即時調整音樂風格、節奏、情緒,甚至混合不同流派,創造出獨特的音景。這種動態交互特性尤其適合現場演出或快速原型設計,爲音樂創作帶來前所未有的靈活性。

例如,用戶可以通過文本提示混合爵士和電子音樂風格,或直接調整音高、節拍每分鐘(BPM)等參數,生成符合特定場景的音樂。DeepMind與格萊美獲獎音樂家Jacob Collier等專業人士合作,確保Lyria RealTime能夠滿足專業創作需求,同時爲新手提供直觀的創作體驗。

多功能Music AI Sandbox,賦能多樣化創作

Lyria2深度整合到谷歌的 Music AI Sandbox 工具集中,爲音樂家和內容創作者提供了全面的創作支持。該工具集包括“Create”功能,用於從文本或歌詞生成全新音樂;“Extend”功能,可延長現有音頻片段;以及“Edit”功能,允許用戶轉換音樂的情緒或風格。這些工具不僅提升了創作效率,還鼓勵創作者探索未知的音樂領域。

此外,Lyria2支持多模態輸入,接受文本、樂譜或音頻片段作爲創作起點,適應從古典到流行、電子等廣泛的音樂風格。谷歌DeepMind強調,Lyria2旨在增強而非取代人類創造力,通過與音樂行業的合作,確保工具符合創作者的實際需求。

負責任的AI部署,保障創作倫理

谷歌DeepMind在Lyria2的開發中注重倫理與安全性,採用 SynthID數字水印技術,將不可感知的水印嵌入AI生成的音頻中,確保內容可追溯且不影響聆聽體驗。這種技術能在音頻經過壓縮或速度調整後仍保持可識別性,應對音樂版權和原創性爭議。

目前,Lyria2僅對部分受信任的測試者開放,谷歌正在通過反饋進一步優化其性能,並計劃未來擴展語言和流派覆蓋範圍。有興趣的創作者可通過DeepMind官網申請加入測試者名單。

Lyria2的發佈進一步鞏固了谷歌DeepMind在生成式AI領域的領先地位。業內人士對其高保真音頻和實時生成能力表示樂觀,認爲其將顯著提升音樂創作效率,尤其是在YouTube Shorts、Google Cloud的Vertex AI平臺等場景中的應用。 然而,AI生成音樂的版權歸屬和原創性問題仍需行業進一步規範,谷歌也需在技術創新與法律倫理之間找到平衡。

入口:https://deepmind.google/models/lyria/