正文

亞馬遜推出全新ASR系統，支持100多語言

發布於AI新閒資訊

時間 :Nov 27, 2023

閱讀 :1分鐘

亞馬遜最新ASR系統覆蓋100多語言，通過語音基礎模型實現顯著準確度提升。系統支持多項特性，成千上萬企業利用該系統解鎖音頻內容見解，提高了可訪問性和可發現性。

通義千問重磅升級：實時語音識別模型 Fun-ASR-Realtime 正式發佈

通義千問推出實時語音識別模型Fun-ASR-Realtime，首字延遲降至百毫秒級，實現“即說即反饋”的流暢交互。其識別準確度接近離線模型，在保證高精度同時突破實時性瓶頸，標誌語音交互體驗邁向新高度。

播客應用Overcast開發者Marco Arment爲降低AI服務成本，自建48臺Mac mini服務器集羣。他利用Apple Silicon芯片的高能效和統一內存優勢，運行本地語音轉錄，以替代昂貴的雲端AI服務。

微信元寶AI助手推出新功能，用戶只需發送一句話即可設置提醒。元寶能自動識別任務內容和時間，並在指定時間通過微信服務通知提醒用戶，讓設置提醒變得簡單便捷。

智譜AI推出GLM-ASR系列開源語音識別模型，併發布桌面端“智譜AI輸入法”，提升PC語音輸入體驗。其中GLM-ASR-2512雲端模型支持實時轉寫，在複雜環境中表現優異，字符錯誤率（CER）極低。

美國Securus公司被曝祕密利用監獄通話記錄開發AI模型，數據來源廣泛，包括地方監獄、移民拘留中心等，旨在實現實時分析。

智啟未來，您的人工智能解決方案智庫