0.33秒生成1秒音頻!Muyan-TTS 開源上線，播客、有聲書場景完美適配

開源語音合成迎來新突破!近日發佈的開源 TTS 模型 Muyan-TTS 專爲播客、有聲書、長視頻等場景設計，具備零樣本語音合成、極速生成與高連貫性朗讀能力，是當前最適合批量化長語音生成的模型之一。

Muyan-TTS 基於超10萬小時播客數據預訓練，僅需 0.33秒即可生成1秒高質量音頻，支持無需打斷地朗讀數分鐘文本，語音自然流暢。更支持說話人定製，任意聲音克隆，一鍵生成具有個性化語氣與節奏的語音內容。

模型已開放至 Hugging Face，支持離線部署，開發者可輕鬆本地推理，適配多樣應用場景:播客生成、有聲書製作、英文視頻配音、AI角色朗讀、智能音箱播報等，極大提升內容生產效率。

感興趣的開發者可前往 Hugging Face 獲取模型權重與示例代碼，開啓你的 AI 語音創作之旅。

GitHub 開源地址:https://github.com/MYZY-AI/Muyan-TTS

HF 模型地址:https://huggingface.co/MYZY-AI/Muyan-TTS

全球首款設計Agent Lovart內測！一句話搞定Logo、視頻、品牌全套

5月12日，Lovart AI正式宣佈推出全球首款設計Agent，定位爲文生圖領域最具創新性的產品形態。作爲一款集成圖像、視頻和音樂模型的AI設計工具，Lovart通過自然語言指令實現從任務拆解到最終輸出的全鏈路自動化設計，徹底顛覆傳統設計工作流。AIbase觀察到，Lovart的Beta測試已在全球引發熱烈反響，吸引了設計師、營銷團隊和初創企業的廣泛關注。體驗地址：https://lovart.ai核心功能:全鏈路設計與多模態協同Lovart AI以其全鏈路設計能力爲核心亮點，用戶僅需一句指令即可完成複雜設計任務。工

OpenAI推出深度研究報告一鍵導出PDF功能

人工智能領域的領軍企業OpenAI宣佈，爲其ChatGPT深度研究（Deep Research）工具新增了一項重要功能——一鍵將深度研究報告導出爲PDF。此功能不僅提升了研究報告的實用性，還進一步推動了AI在企業場景中的落地應用。功能亮點:完整保留格式，專業輸出OpenAI的深度研究工具能夠通過多步驟網絡搜索和信息整合，生成包含引用、表格和圖片的詳盡報告。然而，此前用戶需手動整理或分享這些報告，限制了其在企業環境中的高效使用。新推出的PDF導出功能徹底解決了這一痛點。據OpenAI官方消息，

顛覆傳統ISP，Glass Imaging用AI“重塑攝影”:AR、手機、無人機市場全面瞄準

人工智能成像技術公司 Glass Imaging 宣佈完成2000萬美元A輪融資，由全球知名軟件投資機構 Insight Partners 領投，GV（谷歌風投）、Future Ventures 和 Abstract Ventures 等老股東繼續加碼。此輪融資將用於加速 GlassAI 技術的開發，並拓展其在智能手機、無人機、可穿戴設備等平臺的應用。Glass Imaging 總部位於加州洛斯阿爾託斯，致力於通過人工智能技術解決鏡頭像差、傳感器缺陷和光學模糊等問題，以顯著提升圖像質量。其核心產品 GlassAI，能夠使相機成像性能提升10倍，實現更清晰、更真實的圖像呈現

ChatGPT神更新！Deep Research報告一鍵導出PDF，表格圖像全保留，效率翻倍！

ChatGPT的Deep Research功能正式上線PDF導出功能，爲用戶提供更便捷的報告分享與存檔體驗（https://openai.com）。用戶現可通過點擊分享圖標並選擇“下載爲PDF”，將研究報告導出爲包含表格、圖像、鏈接引文和來源的格式化文檔。這一功能不僅適用於新生成的研究報告，還支持歷史報告的導出，顯著提升了Deep Research的實用性與企業適用性。AIbase觀察到，此更新迅速引發開發者與專業用戶的熱烈討論。功能亮點:完整格式保留與一鍵導出ChatGPT Deep Research的PDF導出功能通過一鍵操作，將複雜的研究報

知名女演員強烈要求 Meta 刪除 AI 僞造廣告，強調肖像權的重要性