谷歌最近在其 Gemini 生態系統中正式推出了最新的音樂生成模型 ——Lyria 3。這一由 Google DeepMind 研發的模型標誌着谷歌在 AI 音樂領域的又一重大進展,也爲用戶帶來了更多創作可能性。此次發佈的 Lyria 3 不僅支持文本、圖片和視頻等多模態輸入,還能生成高保真的 30 秒音樂曲目,適用於多種語言,如英語、德語、西班牙語和印地語。目前,用戶在桌面端已經可以逐步體驗,移動端訪問也將很快開放。

Lyria 3 的核心創新在於其技術升級,具體包括三大亮點:首先是其自動生成歌詞的能力,用戶無需額外輸入即可自動匹配歌詞與旋律;其次,模型對節拍、人聲風格等元素進行了精細的控制,能夠滿足創作者的個性化需求;最後,Lyria 3 具備多模態協同合成的能力,用戶只需上傳一張圖片,模型就能生成與之情緒相符的音樂。

與此同時,谷歌在 Lyria 3 的設計上特別考慮了合規性,以應對日益嚴格的音樂版權法規。所有生成的音頻中都嵌入了 SynthID 水印技術,這使得音樂的來源可追溯,增強了用戶對平臺的信任感。此外,Lyria 3 在處理著名音樂人姓名時也採取了謹慎的策略,確保不會直接複製其特有風格,避免了潛在的版權問題。

不過,儘管 Lyria 3 在流行音樂等主流領域表現優異,但在一些小衆和前衛風格上,其靈活性仍有所欠缺。同時,生成的曲目長度限制在 30 秒,顯示出谷歌當前更側重短內容創作,特別是爲 YouTube Shorts 提供配樂,這也使其在與 TikTok 等平臺的競爭中更具優勢。

隨着 Lyria 3 的推出,谷歌正在積極佈局 AI 音樂生態,意在通過 Lyria 3 與 Gemini 的聯動,打造 “一體化創意套件”。用戶在使用中可享受到更高的生成額度,並得到定製的音樂封面,形成一個閉環的創作體驗。

總的來說,Lyria 3 的發佈不僅是一項技術突破,更在音樂產業的未來發展中帶來了新的挑戰與機遇。谷歌的合規措施與技術創新之間的平衡,將是未來 AI 音樂行業發展的重要課題。