谷歌DeepMind發佈新AI音樂生成模型Lyria2，支持實時創作

谷歌DeepMind正式發佈了其最新音樂生成模型 Lyria2，標誌着人工智能在音樂創作領域的又一重大突破。作爲前代Lyria模型的升級版本，Lyria2以其高保真音質、實時交互功能和多風格適配性，爲音樂家、製作人和內容創作者提供了前所未有的創作工具。

高保真音質，捕捉音樂細微之美

Lyria2在音質表現上實現了顯著突破，能夠生成48kHz立體聲音頻，達到專業級水準。無論是古典音樂的優雅旋律，還是電子音樂的動態節奏，Lyria2都能精準捕捉不同樂器和演奏風格的細微差別。據谷歌DeepMind介紹，該模型通過先進的生成技術，結合自監督學習和自迴歸生成算法，確保音樂作品具有高度的真實感和表現力。

音樂家可以通過簡單的文本提示，例如“歡快的爵士鋼琴曲”或“史詩般的交響樂”，生成符合需求的音樂片段。這種高保真輸出不僅適合專業音樂製作，還能無縫集成到影視、廣告等商業項目中，顯著降低創作門檻和成本。

實時音樂生成，激發創作靈感

Lyria2引入了創新的 Lyria RealTime 功能，允許用戶實時操控音樂的生成過程。創作者可以即時調整音樂風格、節奏、情緒，甚至混合不同流派，創造出獨特的音景。這種動態交互特性尤其適合現場演出或快速原型設計，爲音樂創作帶來前所未有的靈活性。

例如，用戶可以通過文本提示混合爵士和電子音樂風格，或直接調整音高、節拍每分鐘（BPM）等參數，生成符合特定場景的音樂。DeepMind與格萊美獲獎音樂家Jacob Collier等專業人士合作，確保Lyria RealTime能夠滿足專業創作需求，同時爲新手提供直觀的創作體驗。

多功能Music AI Sandbox，賦能多樣化創作

Lyria2深度整合到谷歌的 Music AI Sandbox 工具集中，爲音樂家和內容創作者提供了全面的創作支持。該工具集包括“Create”功能，用於從文本或歌詞生成全新音樂;“Extend”功能，可延長現有音頻片段;以及“Edit”功能，允許用戶轉換音樂的情緒或風格。這些工具不僅提升了創作效率，還鼓勵創作者探索未知的音樂領域。

此外，Lyria2支持多模態輸入，接受文本、樂譜或音頻片段作爲創作起點，適應從古典到流行、電子等廣泛的音樂風格。谷歌DeepMind強調，Lyria2旨在增強而非取代人類創造力，通過與音樂行業的合作，確保工具符合創作者的實際需求。

負責任的AI部署，保障創作倫理

谷歌DeepMind在Lyria2的開發中注重倫理與安全性，採用 SynthID數字水印技術，將不可感知的水印嵌入AI生成的音頻中，確保內容可追溯且不影響聆聽體驗。這種技術能在音頻經過壓縮或速度調整後仍保持可識別性，應對音樂版權和原創性爭議。

目前，Lyria2僅對部分受信任的測試者開放，谷歌正在通過反饋進一步優化其性能，並計劃未來擴展語言和流派覆蓋範圍。有興趣的創作者可通過DeepMind官網申請加入測試者名單。

Lyria2的發佈進一步鞏固了谷歌DeepMind在生成式AI領域的領先地位。業內人士對其高保真音頻和實時生成能力表示樂觀，認爲其將顯著提升音樂創作效率，尤其是在YouTube Shorts、Google Cloud的Vertex AI平臺等場景中的應用。然而，AI生成音樂的版權歸屬和原創性問題仍需行業進一步規範，谷歌也需在技術創新與法律倫理之間找到平衡。

入口：https://deepmind.google/models/lyria/

多模態大模型MMaDA：讓AI學會「跨次元思考」，文本圖像通吃的全能型選手來了！

最近，普林斯頓大學、字節跳動、清華大學和北京大學聯手搞了個大事情，推出了一款名爲 MMaDA 的多模態大模型! 這可不是普通的 AI，它號稱能讓 AI 擁有“深度思考”的能力，還能在文本、圖像、甚至複雜的推理任務之間“七十二變”，表現力直接超越了你熟悉的 GPT-4、Gemini、甚至 SDXL!你可能覺得，現在的多模態模型已經很厲害了，能看圖說話，也能根據文字生成圖片。但 MMaDA 告訴我們:這還遠遠不夠! 傳統的模型在處理不同模態時，往往需要各自獨立的組件或者複雜的混合機制，就像一

杭州市政府工作報告點名 DeepSeek，力挺算法模型企業發展

據澎湃新聞報道，在5月22日開幕的杭州市十四屆人大五次會議上，市長姚高員所作的政府工作報告中特別提到了人工智能企業 DeepSeek（深度求索）及其開源大模型。報告回顧了2024年杭州的工作成就，肯定了 DeepSeek 等一批大模型在低成本下取得出色表現，並指出其發展“震動全球同業”。DeepSeek 作爲杭州本土新興科技力量的代表，與其他五家初創公司一同在去年底至今年初迅速崛起，被譽爲“杭州六小龍”。這些企業專注於人工智能研究與應用，涵蓋了大模型、具身智能等前沿領域。其中

OpenAI聯手Jony Ive打造1億臺AI“伴侶”設備！2026年底前發貨，顛覆智能手機的第三核心設備來了！

OpenAI宣佈以65億美元全股收購由蘋果前首席設計師Jony Ive創立的AI硬件初創公司io，並計劃推出一款革命性的AI“伴侶”設備，目標在2026年底前發貨1億臺。據悉，該設備將完全感知用戶環境，融入日常生活，成爲繼MacBook Pro和iPhone之後的“第三核心設備”。AIbase綜合最新社交媒體動態與權威報道，深入解析這一設備的創新潛力及其對AI硬件市場的深遠影響。AI“伴侶”設備:感知生活，重新定義交互OpenAI首席執行官Sam Altman在內部會議中向員工展示了與Jony Ive團隊合作開發的AI硬件設備，命名爲io

硅基流動升級DeepSeek-R1 等推理模型API ，支持 128K 上下文長度

硅基流動（SiliconCloud）宣佈對其 DeepSeek-R1等推理模型 API 進行了一次重要升級，旨在更好地滿足開發者對長上下文和靈活參數配置的需求。此次升級中，多個推理模型的最大上下文長度被提升至128K，使得模型在思考時能夠更加充分，輸出內容也更爲完整。在此次升級中，多個知名模型，如 Qwen3、QWQ、GLM-Z1等，均支持128K 的最大上下文長度，而 DeepSeek-R1則支持96K。這一提升爲複雜推理任務，如代碼生成和智能體的應用提供了強有力的支持。更爲重要的是，硅基流動還引入了獨立控制 “思維鏈

數據：在 6 個月內，NotebookLM 的月總訪問量增加了 56%