グーグル(Google)は、一部のユーザーに対してmacOSクライアントの大きな音声機能のアップデートをテストしています。今回のテストには以下の3つの主要な機能が含まれます:システムレベルの音声入力、ユーザーが任意のサードパーティアプリでキーボードショートカットを使って全体的な音声からテキストへの入力を可能にする機能;「マジックポインター(Magic Pointer)」、Geminiがリアルタイムでユーザーのカーソルホバー内容をトラッキングし、人間と機械の相互作用における視覚的および論理的な同期を確保する機能;そしてマルチデバイス接続メニュー、今後のデスクトップ間連携の可能性を示唆しています。

このアップデートにより、Gemini Liveのインターフェースが再設計され、モバイル端末のフルスクリーンキャンバスに近づけられています。この動きは、グーグルが2026年夏にGemini Sparkおよび強化された音声機能をリリースする戦略に合致しており、デスクトップ版とウェブ版のエクスペリエンスのギャップを埋めることを目的としています。OpenAIのCodex Remote ControlやAnthropicのClaude's Dispatchなどの競品が下位層に浸透している中、グーグルはスクリーン認識機能とマルチデバイス連携を強化することで、デスクトップ用生産性ツールを全モダリティの知能化に向かって加速させています。