近日,Play AI 正式推出其最具雄心的產品 ——PlayDialog beta版本,能生成對話式的播客音頻。

image.png

這款端到端的 AI 語音模型,利用對話的歷史上下文,能夠調控語調、情感和語速,以實現更自然的語音合成,標誌着人機對話的新高度。PlayDialog 特別適合於製作真實的對話體驗,例如旁白、語音配音、合成播客等,也能在商業環境中提供沉浸式的一對一語音交流體驗,效果類似谷歌的NotebookLM

與此同時,Play AI 還推出了 PlayNote,這是一款可以將多種媒體文件(如 PDF、文本、視頻等)轉化爲對話體驗的工具。用戶可以在幾分鐘內生成播客、簡報、旁白,甚至是兒童故事,並享受到 PlayDialog 所帶來的流暢、自然的語音效果。PlayNote 的獨特之處在於,它也提供 API 接口,使得用戶可以不依賴用戶界面,輕鬆實現音頻內容的程序化生成。

image.png

PlayDialog beta 經過數億次真實對話的訓練,模型規模約爲 Play AI3.0mini 的十倍,能夠在語調(如語音的抑揚頓挫、語速)上與人類的語音表現相匹配。在盲測中,PlayDialog beta 的表現比市場上領先的競爭模型高出兩倍,特別是在表達力方面得分最高

不同於以往的語音模型,PlayDialog beta 可以理解整段對話的上下文,進而影響語音生成的效果。Play AI構建了一種被稱爲 “自適應語音上下文化器”(ASC)的新架構,使得模型能夠利用完整的對話歷史進行迴應,從而讓每一句話都不是孤立的輸出,而是豐富的具備合適的語調、情感和語氣,使得合成的播客彷彿讓聽衆感受到演講者在同一空間內進行交流。

無論是充滿活力的討論,還是需要同理心的敏感話題,PlayDialog 都能無縫適應,讓互動顯得更加自然和人性化。

用戶可以通過 PlayNote 體驗這一切,使用它製作強有力、自然的旁白、播客、簡報等,只需幾分鐘就能完成。PlayNote 也可以通過 API 接口使用,允許開發者以大規模程序化方式生成引人入勝的內容。

提亞入口:https://play.ai/playnote

官方博客介紹:https://blog.play.ai/blog/introducing-playdialog

劃重點:

🌟 PlayDialog beta 是 Play AI 推出的新一代語音模型,能夠更自然地模擬人類對話。

🎤 PlayNote 工具使用戶能夠快速將各種媒體文件轉化爲有聲內容,並支持 API 接口。

🚀 PlayDialog beta 在盲測中表現出色,語音生成的流暢性和情感表達均獲得高分。