在慶祝公司成立16週年之際,Reverie Language Technologies 發佈了一款全新的語音轉文本(STT)模型,旨在應對印度多元化的語言環境。這款模型不僅能夠識別印地語、英語,還可以處理 Hinglish 等混合語言,極大地滿足了銀行和呼叫中心等行業的需求。

語音控制

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

據 Reverie 介紹,該模型在過去一年內處理了300萬次 API 調用,其精確度和速度都表現出色。在與 Deepgram 的獨立測試中,Reverie 的模型在準確率上高出約4.2%,響應速度提升了1.5倍。這使其成爲針對印度用戶的強大語音識別系統。

這款模型的優勢在於其對多語言和文化背景的理解能力。無論是用英語說的數字 “twenty-three”,還是用印地語說的 “तेईस”,該模型都能夠準確識別。此外,它還能識別來自印度各地的名字,考慮到拼寫和發音的差異,這些特性往往是全球模型難以處理的。

除了 Hinglish,Reverie 還推出了一系列針對其他印度語言的 STT 模型,包括泰米爾語、泰盧固語、孟加拉語、馬拉地語、古吉拉特語、卡納達語、馬拉雅拉姆語、阿薩姆語、奧里亞語和旁遮普語。每個模型都針對特定語言的方言和口音進行了獨立訓練,旨在更真實地反映當地人的語言使用習慣。

Reverie 的 R&D 負責人 Pranjal Nayak 表示:“我們的研發一直專注於印度特有的語言挑戰,這款 Hinglish 模型正是其中的成果。它能夠理解印度人在使用數字時的習慣,以及在同一句話中如何混合使用英語和印地語。” 這使得 AI 代理的表現更加自然和人性化。

該模型已經在多個行業中得到應用,例如某大型金融服務公司採用 Reverie 的 STT 引擎處理超過15,000個多語種的債務催收電話,成功實現了高準確度的數字和付款識別。

目前,這款模型已在 Reverie 的 API 平臺上上線,企業可通過雲端或本地部署來使用。其支持特定領域的語言包、數字和名稱的歧義消解以及熱詞增強等功能,所有配置均可通過同一個 API 完成。

劃重點:

🌟 這款新模型在準確率和響應速度上超過 Deepgram,滿足印度市場的需求。  

💬 Reverie 模型能夠理解 Hinglish 等多種語言混合,具備文化背景的深刻理解。  

📈 多個行業已開始應用該技術,顯著提高了語音識別的準確性與效率。