人工智能初創公司 ElevenLabs 於週三推出了一項新功能,名爲 GenFM,該功能允許用戶上傳不同類型的內容以生成多聲道播客,類似於谷歌的 NotebookLM。
這項功能已在 ElevenLabs Reader 的 iOS 應用中上線,支持32種語言,包括英語、印地語、葡萄牙語、中文、西班牙語、法語、德語和日語等。
使用 GenFM 時,用戶可以首先上傳 YouTube 視頻、文本或文檔,應用程序會自動選擇兩個聲音來創建播客。
ElevenLabs 提供了十多種聲音供用戶選擇。應用程序在準備 AI 生成的播客時,用戶可能會看到一些有趣的提示,比如 “添加一些停頓” 和 “插入一些填充詞”。在當前許多工具幫助人們去除 “嗯” 和 “啊” 的背景下,ElevenLabs 卻選擇爲其 AI 生成的播客添加一些人性化的元素。
ElevenLabs 的移動增長負責人 Jack McDermott 在接受 採訪時表示:“我們討論了在多大程度上引入‘嗯’、‘啊’、‘嗯哼’、笑聲和呼吸等類似人類對話的填充詞或覆蓋聲音。我們的目標是在自然人類對話和內容實用性之間找到適當的平衡。”
他還指出,優秀的長格式播客中往往干擾較少,更自然、更深入的對話流是他們追求的體驗,旨在使音頻敘事在不同聲音和語言中更易於訪問。
未來,ElevenLabs 計劃支持更多的自定義選項,並允許用戶添加多個來源來創建生成式 AI 播客。9月份,谷歌推出了 NotebookLM 的 AI 生成對話功能,並在一個月後新增了用戶自定義播客輸出的能力。
本月初,ElevenLabs 還宣佈將投資1100萬美元到波蘭初創企業生態系統,並在華沙開設研發中心,以吸引當地 AI 人才。同時,該公司正在擴展到印度,已招聘了一名業務負責人並正在組建團隊。此外,ElevenLabs 還爲客戶推出了對話 AI 代理。
劃重點:
🌐 ElevenLabs 推出 GenFM 功能,支持用戶上傳視頻或文本生成多聲道播客。
🎙️ 該功能自動選擇兩種聲音,並添加人性化的填充詞以增強自然對話體驗。
🚀 ElevenLabs 計劃未來支持更多自定義選項,並在波蘭和印度擴展業務。