智譜 AI 正式推出了其最新的 GLM-ASR 系列語音識別模型,並將相關技術開源,旨在爲廣大用戶提供更高效的語音交互體驗。這一系列的推出還包括了一款桌面端的 “智譜 AI 輸入法”,爲用戶在 PC 端的語音輸入提供了極大的便利。

image.png

GLM-ASR-2512是智譜 AI 發佈的全球領先的雲端語音識別模型,其主要特點是支持實時語音轉文字,並在複雜的真實環境中表現出色,字符錯誤率(CER)僅爲0.0717。這一卓越的識別精度使其在多場景、多語種及多口音的應用中依然保持行業領先地位。

除了 GLM-ASR-2512,智譜 AI 還開源了 GLM-ASR-Nano-2512。這款模型參數僅爲1.5B,但在語音識別的開源領域中表現爲 SOTA,甚至在部分測試中超越了一些閉源模型。GLM-ASR-Nano-2512的設計使得其能夠在本地運行,既保證了高精度的語音識別能力,又增強了用戶的隱私保護,並減少了交互延遲。

基於以上兩個模型的強大能力,智譜 AI 推出了新款的智譜 AI 輸入法。用戶通過這款輸入法不僅可以實現精準的語音轉文字功能,還能夠進行翻譯和文本改寫等智能操作,真正實現了 “指尖即模型,語音即指令” 的便捷體驗。目前,智譜 AI 輸入法已經對所有用戶開放,並且新用戶還可獲得2000積分,享受長達28天的免費使用時間。

GLM-ASR-Nano-2512:Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512

智譜 AI 輸入法:https://autoglm.zhipuai.cn/autotyper/

劃重點:

🌟 GLM-ASR 系列模型發佈,包含全球領先的雲端語音識別模型和端側模型,識別精度出色。  

🛠️ 新款智譜 AI 輸入法推出,支持語音轉文字、翻譯及改寫,提供便捷的 PC 端語音交互體驗。  

🎁 新用戶可免費獲取2000積分,享受長達28天的使用權,鼓勵更多用戶體驗智能輸入法。