MiniMax推出Voice Design音色設計功能，任意組合語言、口音、音色

MiniMax 最近推出了一項創新功能 ——Voice Design 音色設計，這標誌着語音合成技術的一次重大突破。自5月發佈以來，MiniMax Speech-02模型在 Artificial Analysis 榜單上穩居全球第一，並贏得了用戶的廣泛認可。迄今爲止，Speech-01和 Speech-02兩代模型已經幫助客戶生成了超過1.5億小時的語音，與全球30多個國家的用戶建立了合作。

Voice Design 功能允許用戶通過自然語言描述自己理想中的音色，從而實現對語音的多維度精準控制，甚至可以生成一些世界上從未存在過的音色。這項新功能與 Speech-02語音模型緊密結合，用戶在進行文字轉語音時，能夠真正實現 “所需即所得”。用戶可以自由選擇 “任意語言 × 任意口音 × 任意音色”，進行全自定義的無限組合。

通過簡單的文本描述，用戶可以得到不同風格的 AI 助手語音。例如，用戶可以請求一個積極鼓勵的 AI 助手，語調活潑，韻律變化豐富，來表達關心和支持;或者選擇一個嚴厲的 AI 助手，快速的女聲帶有命令和責備的語氣;還可以讓助手以小心翼翼的語氣表達歉意。

Voice Design 功能解決了語音合成領域的兩個主要挑戰。首先，現有的音色庫雖然質量高，但通常難以滿足用戶在特定場景下的細分需求;其次，儘管復刻音色可以實現 “所聽即所得”，用戶爲了獲得滿意的效果通常需要花費大量時間準備高質量的輸入素材，還可能面臨版權風險。

通過 Voice Design，用戶只需描述他們對音色的需求，模型便會自動將其拆解爲音色相關的描述信息，生成新的音色編碼。用戶還可以像抽卡一樣多次嘗試，輕鬆獲得理想的專屬音色，並將其存儲用於後續音頻創作。

MiniMax 始終致力於降低全球用戶使用 AI 技術的門檻，讓不同語言的用戶都能體驗到語音模型帶來的價值。立即打開 MiniMax Audio，體驗這一創新功能吧!

國內版:minimaxi.com/audio

海外版:minimax.io/audio

劃重點:
🎤 MiniMax 推出 Voice Design 音色設計功能，用戶可通過自然語言生成個性化語音。
🌍 該功能與 Speech-02模型結合，支持 “任意語言 × 任意口音 × 任意音色” 的自定義組合。
⚙️ Voice Design 解決了語音合成中的音色匹配難題，用戶只需簡單描述即可獲得滿意的音色。

AI日報：月之暗面首款自主智能體Kimi-Researcher；MiniMax推音色設計功能；Jaaz發佈Lovart AI本地化替代品

歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南，每天我們爲你呈現AI領域的熱點內容，聚焦開發者，助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://top.aibase.com/1:月之暗面發佈首款自主智能體 Kimi-Researcher月之暗面推出Kimi-Researcher，多輪搜索與推理能力強，在HLE測試中超越谷歌和OpenAI同類產品。【AiBase提要:】🌐 Kimi-Researcher基於k-系列模型，通過端到端強化學習訓練。📈 在HLE測試中Pass@1得分率26.9%，Pass@4準確率40.17%。🔗 未來將開源基礎預訓練模型，助

特斯拉Robotaxi無人出租車正式測試：全自動駕駛邁向新里程碑！

Tesla在德克薩斯州奧斯汀啓動了Robotaxi無人出租車的公開測試，標誌着其全自動駕駛（FSD）Unsupervised模式的重大突破。此次測試中，車輛駕駛座完全空置，運行全程由AI系統自主控制，僅在副駕駛位置配備一名安全監控員，且無方向盤或踏板控制權限。全自動駕駛新篇章:FSD Unsupervised模式亮相Tesla Robotaxi測試採用FSD Unsupervised（無監督全自動駕駛）模式，車輛完全依賴AI系統進行導航、決策和操作，無需人類駕駛員干預。測試車輛爲Tesla Model Y，配備最新AI芯片和軟件，車身帶有“Robotaxi”標識。

阿里雲推出自動駕駛模型加速框架PAI-TurboX 訓練時間可縮短50%

近日，阿里雲正式發佈面向自動駕駛領域模型的訓練、推理加速框架——PAI-TurboX，旨在提升感知、規劃控制乃至世界模型的訓推效率。該框架在多個行業模型的訓練任務中展現出了顯著優勢，可縮短高達50%的時間。 PAI-TurboX框架的應用範圍廣泛，涵蓋了多模態數據預處理、離線大規模模型訓練以及實時智駕推理等多個環節，爲自動駕駛、具身智能等領域提供了全面解決方案。目前，該框架已成功應用於多家車企，助力其提升自動駕駛技術的研發和應用效率。在系統側，PAI-Tur

智能機器人公司銀河通用獲寧德時代領投超 10 億元融資，具身智能賽道迎來重大突破

智能機器人公司銀河通用完成了一輪超過10億元的融資，成爲2023年以來具身智能領域最大的一筆單筆融資。此次融資由全球知名電池製造商寧德時代和溥泉資本領投，國開科創、北京機器人產業基金、紀源資本等多家機構參與跟投，多個老股東也加碼投資。圖源備註:圖片由AI生成，圖片授權服務商Midjourney銀河通用成立於2023年5月，是近年來具身智能行業內備受矚目的項目之一。在短短時間內，公司已累計融資超過23億元，先後完成了超7億元的天使輪融資及5億元的戰略輪融資。銀河通用與宇

LinkedIn CEO 透露：AI 寫作助手未能如預期受歡迎

根據 LinkedIn 首席執行官瑞安・羅斯蘭斯基（Ryan Roslansky）的說法，儘管 LinkedIn 用戶普遍接受 AI 技術，但 AI 生成的帖子潤色建議卻未能獲得預期的熱度。圖源備註：圖片由AI生成，圖片授權服務商Midjourney羅斯蘭斯基在接受彭博社採訪時表示:“坦白說，這並沒有我想象中的那麼受歡迎。” 他指出，在 LinkedIn 上發佈內容的門檻相對較高，因爲 “這是你在線的簡歷”。此外，用戶在發佈內容時面臨的風險也更加顯著，如果內容被指責過於明顯是由 AI 生成的，可能會帶來真實的負面影響。他提

​MiniMax推出Voice Design音色設計功能，任意組合語言 、口音、音色

相關推薦