ElevenLabs 是一家專注於 AI 語音克隆和文本轉語音 API 的初創公司,近日宣佈推出用戶可以構建完整對話式AI智能體的新功能。
用戶現在可以在 ElevenLabs 的開發者平臺上,依據自己的需求,定製對話智能體的多種變量,比如語音語調和回覆長度。
ElevenLabs 過去主要提供不同的語音和文本轉語音服務。公司增長主管 Sam Sklar 在接受 TechCrunch 採訪時表示,許多客戶早已在使用該平臺創建對話式AI智能體。但在集成知識庫和處理客戶中斷方面是最大的挑戰。因此,ElevenLabs 決定構建一個完整的對話機器人管道,以便簡化這一過程。
用戶可以通過登錄 ElevenLabs 賬號,選擇模板或創建新項目來開始構建對話智能體。他們可以選擇智能體的主要語言、首條消息和系統提示,以確定智能體的個性。
此外,開發者還需選擇大型語言模型(如 Gemini、GPT 或 Claude)、響應的溫度(決定創意性)以及令牌使用限制。
用戶還可以根據自己的需求添加知識庫,如文件、URL 或文本塊,以增強對話機器人的能力。同時,他們可以將自己的自定義大型語言模型與該機器人集成。ElevenLabs 的 SDK 兼容 Python、JavaScript、React 和 Swift,此外,該公司還提供 WebSocket API,便於進一步定製。
公司還允許用戶定義數據收集標準,例如與智能體對話的客戶姓名和電子郵件,並使用自然語言定義通話的成功與否評估標準。
ElevenLabs 正在利用其現有的文本轉語音管道,同時也在爲新對話式人工智能產品開發語音轉文本功能。目前,該公司並未單獨提供語音轉文本 API,但未來可能會推出,從而與谷歌、微軟和亞馬遜等公司的語音轉文本 API 競爭,以及與 OpenAI 的 Whisper、AssemblyAI、Deepgram、Speechmatics 和 Gladia 等專業 API 展開競爭。
該公司計劃以超過30億美元的估值籌集新一輪資金,且正與其他語音 AI 初創企業如 Vapi 和 Retell 展開競爭,這些公司同樣在構建對話智能體。更重要的是,ElevenLabs 將與 OpenAI 的實時對話 API 競爭。不過,ElevenLabs 相信其定製化能力和切換模型的靈活性,將使其在競爭中佔據優勢。
劃重點:
💬 ElevenLabs 推出了構建對話式AI智能體的新功能,允許用戶自定義多種變量。
📚 用戶可以添加知識庫以增強智能體能力,並將自定義大型語言模型與之集成。
🚀 ElevenLabs 計劃以超過30億美元的估值籌集資金,並與 OpenAI 等競爭對手展開競爭。