現地時間4月6日(月曜日)、グーグルはiOSプラットフォームで「Google AI Edge Eloquent」という実験的な音声入力アプリを静かにリリースしました。このアプリは「オフライン優先」と「スマートな編集」を特徴とし、エッジ側AI技術を利用して自然な口語をリアルタイムで専門的で簡潔なテキストに変換することを目指しています。この行動は、Wispr FlowやSuperWhisperが牽引する高級AI音声認識分野にグーグルが正式に参入したことを示しています。
コアテクノロジーと機能の特徴:
Eloquentには、グーグルが最新に公開したGemma4シリーズ(E2B/E4B仕様)の自動音声認識(ASR)モデルが搭載されています。このモデルは完全にオフラインで動作し、モデルパッケージをダウンロードした後はローカルでトランクリプションが可能で、プライバシーを保護し、遅延を低減します。アプリには強力な「スマートなノイズ除去」機能があり、「ん」「あ」などの語尾や繰り返し修正を自動的に識別・フィルタリングし、論理的なテキストを出力します。
製品の深い統合とインタラクティブ性:
マルチモーダルスタイル変換: 「ポイント」「正式」「短縮」「完全」の4つのテキスト処理モードを提供。
クラウド連携(オプション): クラウドモードを起動すると、アプリはクラウド上のGeminiモデルを使用してテキストを深くクリーンアップします。
個別化された文脈: Gmailからユーザー固有のキーワード、名前、用語をインポートでき、カスタム辞書を作成できます。
生産性統計: レコーディング文字数、1分あたりの文字数(WPM)、および履歴セッション記録をリアルタイムで表示。
市場戦略と将来の展開:
現在、このアプリはiOS App Storeで
