MiniMax 最近推出了一項創新功能 ——Voice Design 音色設計,這標誌着語音合成技術的一次重大突破。自5月發佈以來,MiniMax Speech-02模型在 Artificial Analysis 榜單上穩居全球第一,並贏得了用戶的廣泛認可。迄今爲止,Speech-01和 Speech-02兩代模型已經幫助客戶生成了超過1.5億小時的語音,與全球30多個國家的用戶建立了合作。
Voice Design 功能允許用戶通過自然語言描述自己理想中的音色,從而實現對語音的多維度精準控制,甚至可以生成一些世界上從未存在過的音色。這項新功能與 Speech-02語音模型緊密結合,用戶在進行文字轉語音時,能夠真正實現 “所需即所得”。用戶可以自由選擇 “任意語言 × 任意口音 × 任意音色”,進行全自定義的無限組合。
通過簡單的文本描述,用戶可以得到不同風格的 AI 助手語音。例如,用戶可以請求一個積極鼓勵的 AI 助手,語調活潑,韻律變化豐富,來表達關心和支持;或者選擇一個嚴厲的 AI 助手,快速的女聲帶有命令和責備的語氣;還可以讓助手以小心翼翼的語氣表達歉意。
Voice Design 功能解決了語音合成領域的兩個主要挑戰。首先,現有的音色庫雖然質量高,但通常難以滿足用戶在特定場景下的細分需求;其次,儘管復刻音色可以實現 “所聽即所得”,用戶爲了獲得滿意的效果通常需要花費大量時間準備高質量的輸入素材,還可能面臨版權風險。
通過 Voice Design,用戶只需描述他們對音色的需求,模型便會自動將其拆解爲音色相關的描述信息,生成新的音色編碼。用戶還可以像抽卡一樣多次嘗試,輕鬆獲得理想的專屬音色,並將其存儲用於後續音頻創作。
MiniMax 始終致力於降低全球用戶使用 AI 技術的門檻,讓不同語言的用戶都能體驗到語音模型帶來的價值。立即打開 MiniMax Audio,體驗這一創新功能吧!
國內版:minimaxi.com/audio
海外版:minimax.io/audio
劃重點:
🎤 MiniMax 推出 Voice Design 音色設計功能,用戶可通過自然語言生成個性化語音。
🌍 該功能與 Speech-02模型結合,支持 “任意語言 × 任意口音 × 任意音色” 的自定義組合。
⚙️ Voice Design 解決了語音合成中的音色匹配難題,用戶只需簡單描述即可獲得滿意的音色。