智譜AIは、最新のGLM-ASRシリーズ音声認識モデルを正式にリリースし、関連技術をオープンソース化しました。これにより、ユーザーに効率的な音声インタラクション体験を提供することを目的としています。このシリーズのリリースには、「智譜AI入力法」というデスクトップ向けアプリも含まれており、PCでの音声入力を非常に使いやすくしています。

GLM-ASR-2512は、智譜AIが公開した世界最先端のクラウド音声認識モデルです。主な特徴はリアルタイムでの音声からテキストへの変換であり、複雑な現実環境においても優れた性能を発揮します。文字誤字率(CER)はわずか0.0717で、多様なシーン、言語、および発音に対応する中でも業界のリーダーとしての地位を維持しています。
GLM-ASR-2512に加え、智譜AIはGLM-ASR-Nano-2512もオープンソース化しました。このモデルのパラメータ数は1.5Bと少なく、音声認識のオープンソース分野においてSOTA(最良)の性能を示しており、一部の非オープンソースモデルを上回る場合もあります。GLM-ASR-Nano-2512はローカルで動作できるように設計されており、高精度な音声認識機能を保ちつつ、ユーザーのプライバシー保護を強化し、インタラクションの遅延を減らすことができます。
これらの2つのモデルの強力な能力に基づき、智譜AIは新製品「智譜AI入力法」をリリースしました。この入力法を通じて、ユーザーは正確な音声からテキストへの変換だけでなく、翻訳やテキストの再構成などのスマートな操作も行うことができます。これは「指先にモデルがあり、音声が指示となる」という使い勝手の良い体験を実現しています。現在、智譜AI入力法はすべてのユーザーに開放されており、新規ユーザーには2000ポイントがプレゼントされ、最大28日間の無料利用期間が提供されます。
GLM-ASR-Nano-2512:Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512
智譜AI入力法:https://autoglm.zhipuai.cn/autotyper/
注目点:
🌟 GLM-ASRシリーズモデルのリリース。世界最先端のクラウド音声認識モデルとエッジ側モデルを含み、高い認識精度を誇ります。
🛠️ 新たな智譜AI入力法の登場。音声からテキストへの変換、翻訳、テキストの再構成をサポートし、PCでの音声インタラクションをより使いやすくします。
🎁 新規ユーザーは2000ポイントを無料で入手でき、最大28日間の利用権を得られます。スマートな入力法の体験を広めるための取り組みです。
