OpenAIは、少数のChatGPT Plusユーザーに対し、高度な音声モードの提供を開始したと発表しました。この高度な音声モードは、より自然でリアルタイムな会話を実現し、ユーザーはいつでも会話を中断でき、ユーザーの感情を感知して応答します。
このアルファ版のユーザーは、モバイルアプリで手順とメッセージを含むメールを受け取ります。現在、テスト権限を取得しているユーザーはOpenAIからメールを受け取っています。
OpenAIは順次ユーザーを追加していく予定で、秋にはPlusユーザー全員が利用できるようになる予定です。さらに、ビデオと画面共有機能の導入も発表されました。
OpenAIは、GPT-4oの音声機能を、45言語100名以上の外部テストメンバーでテストしたとのことです。プライバシー保護のため、4つのプリセット音声のみを使用するようモデルを訓練し、これらの音声とは異なる出力を防ぐシステムを構築しました。
OpenAIは8月初旬に、GPT-4oの能力、限界、安全性評価に関する詳細なレポートを公開する予定です。