最近、OpenAI は自社の公式ウェブサイトで、ChatGPT が「音声モード」を本格的にチャット画面に統合したことを発表しました。このアップデートにより、ユーザーは音声による会話を行う際、音声で質問できるだけでなく、地図や画像などの関連する視覚情報もリアルタイムで表示できます。また、システムは自動的に文字起こしを作成し、ユーザーが会話内容を振り返ったり確認したりしやすくします。

image.png

以前は、音声対話機能は独立したモジュールであり、ユーザーは手動で音声モードに切り替える必要がありました。しかし今回のアップデートにより、ユーザーはメインのチャットウィンドウから直接音声インタラクションを開始でき、全体的な使用体験がよりスムーズで効率的になります。このマルチモーダルな相互作用方式は、情報伝達の効率を向上させ、ユーザーの交流体験を豊かにしています。

新しい音声モードの大きな特徴の一つは、視覚情報の提示能力です。OpenAI はデモを通じて、ユーザーが音声で質問すると、ChatGPT が自然でスムーズに音声で回答し、チャット画面にリアルタイムで関連するグラフや画像を表示できることが示されました。このような相互作用方式により、ユーザーは情報を得るだけでなく、コンテンツをより直感的に理解できるようになります。

異なるユーザーの好みに対応するために、OpenAI はアップデートに「後悔ボタン」オプションを追加しました。音声だけの没入型コミュニケーションを好むユーザーに対して、新しい設定メニューから旧バージョンの独立音声モードに簡単に切り替えられる機能が提供され、ユーザーが自身のニーズに最適な使い方を選べるようにしています。

OpenAI のこのアップデートは、同社が AI 製品分野で継続的に探求と革新を遂行する決意を示しています。これまでに、商品比較用の AI ショッピングアシスタント、iCloud キーチェーンをサポートする Atlas AI ブラウザの新機能、一部地域でリリースされたグループチャット機能など、多数の新機能をリリースしてきました。これらのアップデートは、OpenAI が AI 応用の境界を広げ続ける努力を反映しています。

ポイント:  

🌟 ChatGPT は音声モードを正式に統合し、メイン画面で音声とテキストのシームレスな相互作用が可能です。  

🖼️ 音声で質問するとき、システムは地図や画像などの関連する視覚情報をリアルタイムで表示できます。  

🔄 アップデートには切り替え機能が搭載されており、ユーザーは必要に応じて従来の独立音声モードを選択できます。