アップルはこのほど、イスラエルの音声人工知能スタートアップ企業であるQ.aiの買収を正式に確認した。この動きは、アップルがAI音声インタラクション分野で重要な一歩を踏み出したものと見られ、最高レベルの技術を通じてiPhoneなどのデバイスの音声アシスタントが極端な環境下でも「心の声」を理解できるようにするためのものである。
Q.aiのチームはすでに全体としてアップルに統合されている。注目すべきは、同社のCEOアヴィアド・マイゼルズ氏が2度目に自らの会社をアップルに組み入れたことである。2013年には彼が設立したPrimeSenseもアップルに吸収された。アップルのハードウェア技術上級副社長ジョンニー・スロージー氏は今回の買収を高く評価し、Q.aiが画像処理と機械学習の組み合わせでの応用において非常に創造的であると称賛している。
長い間、Siriは騒音のある背景やユーザーの発音が曖昧な際の認識率に対して批判を受けてきた。一方で、Q.aiの強みは、非理想状態における音声理解力を向上させることに特化している点である。この技術は、周囲のノイズを効果的にフィルタリングするだけでなく、ボリュームが極めて低い「ささやき」の音声を正確に解釈することも可能にする。これにより、Siriの使用場面は大幅に広がる。
現在、グーグルやOpenAIはAIチャットアシスタントの音声インターフェースにおいて先んじている。競争が激化する中、アップルはSiriの「改修プロジェクト」を急いでおり、この老舗の音声アシスタントをより個別化され、会話的なものにしようと試みている。
外からは今回の買収によって得られる技術が直近のシステムの大規模バージョン更新には間に合わない可能性があると考えられているが、長期的にはQ.aiの参加がSiriの今後のアップデートに重要な動力となるだろう。より深い機械学習能力を導入することで、アップルはSiriが複雑な現実シーンでのパフォーマンスを根本的に改善し、人間と機械の音声インターフェースの正確さを再定義しようとしている。
