アップルのMacユーザーがローカルでオフラインで生成型大規模モデルを実行するハードルはさらに低下しています。最新の技術動向によると、グーグル傘下の実験的アプリケーションAI Edge Galleryが今やmacOSプラットフォームに正式リリースされました。これにより、Macユーザーはクラウドの計算能力に頼ることなく、ローカル環境で非常にプライベートで完全なオフラインでのチャット、画像処理および意味理解が可能です。

OllamaやLM Studioなどの業界で一般的な汎用的な第3者オープンソースモデル管理プラットフォームとは異なり、グーグルが今回リリースしたAI Edge Galleryは深い垂直統合戦略を採用しています。このアプリケーションは現在、グーグル自身のオープン大規模モデルエコシステムをホスティングし最適化することに焦点を当てており、最初のバージョンでは5つのインストラクションチューニングされた専用モデルが提供されています。その中にはパワフルなGemma-4-12B-it、そしてエッジ側パラメータアンロードアーキテクチャを特徴とするGemma-4-E2B-it、Gemma-4-E4B-it、Gemma-3n-E2B-it、Gemma-3n-E4B-itが含まれます。

image.png

これらの初出モデルの中で、業界から最も注目されているのは1200億パラメータを持つエッジ側モデルGemma412Bです。グーグル公式によると、このモデルはマックのマシンの下層アーキテクチャとmacOSの深くの適合性により、16GBメモリの一般的なマックコンピュータでもテキスト、ビジュアル、音声などマルチモーダル入力を非常にスムーズにローカルで処理できます。その優れたローカルコード作成と論理分析能力により、薄型ノートパソコンが常にマルチモーダルインタラクションを備えたオフラインスマートエージェントに変身させることができます。

コアモデルライブラリの拡張に加え、グーグルはMacエコシステム向けに無料のエッジ側音声効率ツール「Google AI Edge Eloquent」も同時にリリースしました。このツールはオフラインの知能音声入力サービスを特徴としており、ユーザーの音声情報を正確にキャプチャして文字起こしでき、またローカルでリアルタイムで不要な言葉や口ミスを除去し、テキストを軽度に整えることが可能です。これにより、口頭表現がより明確な書面文に変換されます。

伝統的な音声入力ソフトウェアにおける特定の専門分野での誤った修正という課題を完全に排除するために、Eloquentは親切にも「カスタム語彙リスト」機能を開放しました。ユーザーは自らのニーズに応じて、ソフトウェア内で個人名、特定の業界用語、日常的に頻繁に使用するフレーズを事前に入力することができます。すべての音声分析とテキスト編集プロセスがマックのローカルチップ上で閉じた環で行われるため、データをクラウドにアップロードする必要がなく、職場の人々がデータプライバシーや商業機密を厳格に保護するニーズを大幅に満たします。