5月7日、QwenはPC版にAI音声入力機能をリリースしました。ユーザーはショートカットキーを使用して、さまざまなデスクトップアプリケーションで直接利用できます。Qwenの音声入力は、口語表現のノイズ語の除去、誤りの修正、形式整備などの機能をサポートしており、文脈に基づいて知的返答を行うことができ、創作や質問、翻訳などの指示を直接下すことも可能です。

Qwenの音声入力は非常に強力な意味解析能力を持っています。たとえば、口頭ミスが混ざった会話の例を挙げると、「王さん、会議は2時…いや3時、場所は古い会議室、忘れずにあの…市場調査レポートを持ってきてね。」このような文章でも、Qwenは「あの」「ええと」などの不要な言葉をリアルタイムでフィルタリングし、口頭ミスを修正し、構造化されたテキストを出力します。「王さん、会議は午後3時、場所は古い会議室、市場調査レポートを持ってきてください。」

4d105a28e0a11d7d174fd97a2192c2eb.jpg

口語表現の再構築は文字の簡略化だけでなく、論理的な間違いの修正と構造化された整理にも含まれます。ユーザーが週報や記録を作成する際、表現が論理的に飛躍していても、Qwenは文脈に基づいて意味を要約します。たとえば、ユーザーが散らばった口述によって作業進捗を述べても、Qwenは要点が明確な構造化された週報に自動的に整理します。

オフィス作業や創作を行う際、ユーザーは編集画面から離れることなく、音声指令でQwenを利用できます。例えば、本文に昨年のGDPデータを挿入したい場合は、「2025年の全国GDPデータを挿入してください」と言えばよいです。ウェブページを閲覧したり、専門的な英語論文を読んでいる際に不明な点があれば、選択した上で「説明してください」「翻訳してください」と言えば、Qwenが自動的に説明や翻訳を行います。

钉钉(DingTalk)、WeChat、メールなどのシナリオでは、ユーザーはQwenに文脈に基づいた返信を自動生成してもらうことができます。たとえば、顧客への英語のメールに返信する場合、ユーザーが中国語で簡単な口述をすれば、Qwenは入力欄に正しい形式の英語の返信を作成します。

現在、Qwenの音声入力機能はすべてのユーザーに完全に公開されており、すべてのユーザーがQwenのPC版を無料で利用できます。