グーグルが静かに「Google AI Edge Eloquent」をリリース、Gemma4をベースにした無料オフラインAI音声変換ツール

現地時間4月6日（月曜日）、グーグルはiOSプラットフォームで「Google AI Edge Eloquent」という実験的な音声入力アプリを静かにリリースしました。このアプリは「オフライン優先」と「スマートな編集」を特徴とし、エッジ側AI技術を利用して自然な口語をリアルタイムで専門的で簡潔なテキストに変換することを目指しています。この行動は、Wispr FlowやSuperWhisperが牽引する高級AI音声認識分野にグーグルが正式に参入したことを示しています。

コアテクノロジーと機能の特徴:

Eloquentには、グーグルが最新に公開したGemma4シリーズ（E2B/E4B仕様）の自動音声認識(ASR)モデルが搭載されています。このモデルは完全にオフラインで動作し、モデルパッケージをダウンロードした後はローカルでトランクリプションが可能で、プライバシーを保護し、遅延を低減します。アプリには強力な「スマートなノイズ除去」機能があり、「ん」「あ」などの語尾や繰り返し修正を自動的に識別・フィルタリングし、論理的なテキストを出力します。

製品の深い統合とインタラクティブ性:

マルチモーダルスタイル変換: 「ポイント」「正式」「短縮」「完全」の4つのテキスト処理モードを提供。
クラウド連携（オプション）: クラウドモードを起動すると、アプリはクラウド上のGeminiモデルを使用してテキストを深くクリーンアップします。
個別化された文脈: Gmailからユーザー固有のキーワード、名前、用語をインポートでき、カスタム辞書を作成できます。
生産性統計: レコーディング文字数、1分あたりの文字数（WPM）、および履歴セッション記録をリアルタイムで表示。

市場戦略と将来の展開:

現在、このアプリはiOS App Storeで

グーグルがGemma4 E2Bアーキテクチャを発表、スマートフォンでローカルにAIを実行する技術に質的な進化

グーグルDeepMindはオープンソース大規模モデルGemma4を発表しました。パラメーター数は約300億にとどまりますが、「パラメーターあたりの知能密度」が顕著に向上し、1年半前のトップクラスの非開示モデルと同様の性能を発揮します。そのコアな突破点は、パラメーターのアンロードを可能にする「E2B（エーツービー）」アーキテクチャの導入であり、これはオープンソース大規模モデルの基盤アーキテクチャにおける重要なアップグレードを示しています。

アップルのローカルAIが急成長！oMLX 0.3.9の大規模更新：Gemma 4の視覚処理高速化＋ワンクリックでCopilotにアクセス。クラウド大規模モデルの優位性が全面的に均等化

Apple SiliconのローカルAIエコシステムに重要なアップデート：oMLXフレームワークv0.3.9.dev2リリース。Gemma4のMTP視覚パス、DFlashエンジン、ParoQuant量子化技術を深く統合し、画像・テキストのマルチモーダル処理速度と使いやすさを大幅向上。AppleのエッジAI競争力を強化。....

グーグルGemma4 推理速度が3倍に高速化オフライン大モデルの時代が本当に訪れた

Googleは最近、オープンソースモデルGemma4向けにマルチトークン予測（MTP）ドラフターを発表。投機的デコードアーキテクチャを活用し、推論速度を最大3倍に向上させつつ、出力品質と論理能力を維持。リリース後、ダウンロード数が急増し、世界で最も注目されるオープンソースモデルの一つとなった。....

人気記事予約：トークンの不安から卒業！ブラウザでローカルにGemma4を走らせる手描きフロー図はすべて無料

モバイル端末で大規模モデルを実行することはすでに一般的となり、ブラウザ内に強力なAI機能が組み込まれる流れとなっています。開発者はGoogleのTurboQuantアルゴリズムを利用して、Gemma4モデルをブラウザに配置することに成功しました。ユーザーはAPIの設定やサブスクリプション費用を必要とせず、ローカルでスムーズなAIインタラクションを実現できます。そのコアは、TurboQuantアルゴリズムによる記憶の革命です。

グーグルが初のオフラインAI音声認識アプリ「Eloquent」をリリース：スマートフォンが専門の速記士に変わる

GoogleがiOS向けにオフライン音声入力アプリ「Google AI Edge Eloquent」を発表。軽量モデルGemmaを採用し、ネット接続不要で動作。プライバシー保護と効率化を実現し、音声テキスト化の冗長性や不自然な文を自動修正する機能を搭載。....