最近、OpenAI は macOS プラットフォームで注目を集める新機能「ChatGPT 音声録音および字幕作成モード」をリリースしました。この機能は有料ユーザー向けに設計されており、会議やブレインストーミングのディスカッション、個人の音声ノートなどのさまざまな音声コンテンツをより効率的に記録・分析するためのものです。
6月初頭にアップデート動画が公開されて以来、この新しい機能は期待されています。しかし現在、この機能は macOS システム上の GPT-4o の有料ユーザーに限定されており、対応する有料タイプには Plus、Enterprise、Edu、Team、Pro のワークスペースが含まれます。注目すべきは、Android や Windows のユーザー、およびウェブ版の ChatGPT は現在この機能を使用できないことであり、一部のユーザーにとっては残念な点です。
図の出典:AIによって生成された画像、画像のライセンス提供者:Midjourney
では、この録音モードはどのように動作するのでしょうか?この機能はマイクとシステムの音声を同時にキャプチャし、チャットインターフェース内でテキスト記録とスマートサマリーを作成します。録音されたサマリーにはタイムスタンプが付いているため、ユーザーは特定の時間帯の会議を簡単に検索・振り返ることができます。さらに、ChatGPT は以前の録音内容やテキスト記録を利用して、より正確で有益な回答を提供します。
使用に関しては、1回の録音の最大時間は120分までで、この時間を超えると自動的に録音が停止され、転記された内容はプライベートキャンバスにアップロードされます。強調しておくべきは、OpenAI は元の音声データを保存しないということです。転記が完了すると、すぐに元の録音が削除されます。また、録音された音声はモデルのトレーニングには使用されず、ただしユーザーが「すべての人を改善するためのモデル」の機能を有効にした場合、OpenAI は転記されたテキストを審査してモデルの改善に使用することがあります。
チーム、企業、教育用のワークスペースのユーザーについては、デフォルトではモデルトレーニングから除外されます。ワークスペースのオーナーは設定で録音機能をオフにすることができます。
この新しい機能は、ChatGPT を利用する有料ユーザーにとって、音声の記録と分析に便利なツールを提供し、作業効率を大幅に向上させます。会議でも日常的な業務でも、ChatGPT の音声転記機能は間違いなく注目されるオフィスツールとなるでしょう。