インドの音声シリーズプラットフォーム製造企業であるポケットFMは、人工知能技術に大きく賭けており、「音声分野のNetflix」を目指している。このスタートアップ企業は、スパーキー・ベンチャーズの支援を受けている。最近、同社は脚本家がコンテンツをより迅速に作成できるよう支援するAIツールキットをリリースした。これは、数百エピソードに及ぶ音声シリーズに対するユーザーの需要に対応するためである。
ポケットFMのビジネスモデルは、ユーザーの好みに合った音声シリーズを提供することであり、これには大量のコンテンツを迅速に公開することが求められる。そのため、同社はコピロットと呼ばれるAIライティングツールを開発した。このツールは、より良いエピソードの結末を提案したり、物語の魅力を高める機能などを備えている。
創業者のロハン・ナヤク氏は、これらのAIツールをすべての脚本家に推進し、彼らがエピソードを作成する時間を短縮することを目的としている。以前からポケットFMは一部のAIツールを使用しており、例えばElevenLabsを利用して音声シリーズの声を生成し、内部でライティングや改編を補助するAIツールをテストしていた。
コピロットの機能は非常に豊富である。このツールは、記述的な文章を対話形式に変換し、特定のセグメントに対して最適化を行うことができる。また、「ビート分析」という機能もあり、特定のタイプの音声シリーズに特徴的なスタイルに基づいて書風を構築し、コンテンツの魅力を高めることができる。さらに、コピロットは基本的なチャットボットのようなライティング機能も備えており、「要約」「拡張」およびプロンプトからテキストを生成する能力がある。
コピロットを開発するために、ポケットFMは数千時間のデータポイントを分析し、特定のジャンルのストーリーにおいてユーザーの関与パターンを深く研究した。これらの分析結果を基に、このツールはキャラクター間の衝突を増加させるためにライティングアドバイスを追加し、エピソードの刺激的な終わりの提案を専門に行うようになった。AIはまた、音声制作過程における背景効果のタグを提案する機能もある。
このツールは、キャラクターの概要や関係性、および異なるエピソードのストーリーの要点を自動的に生成し、クリエイターが執筆時にいつでも参照できるようにする。コピロットはまた、レビュー機能も備えており、エピソードのポイントや文法的問題をチェックし、コメントを通じて定性的なフィードバックを提供する。
技術面では、ポケットFMは小規模なモデルを訓練して、ストーリーの文脈の一貫性を維持し、キャラクターの開発経路や関係設定、および叙述の一貫性を保つ。同時に、同社はユーザーの信号を活用して、ストーリーによりドラマチックな要素を追加している。
国際展開と現地化戦略
AIツールのリリースに伴い、ポケットFMはさまざまな市場向けの翻訳ツールも発表した。これらのツールは、テキストを一種類から別の言語に翻訳するだけでなく、人物名やフレーズを調整し、ターゲット地域の文化的背景に適合させることも可能である。
同社は今年初めにドイツを最初の市場として、コピロットキットの一部としてこのツールを導入し、他の地域からのストーリーをリメイクするために使用した。報道によると、同社は昨年ヨーロッパ諸国でのユーザー獲得に苦労していた。
ナヤク氏は、今回の試験で優れた成果を得たと語り、月次のアプリ内収益が継続的に増加し、6月には70万ドルを突破したと述べた。「新しい地域に拡大するとき、通常12〜18か月かかる。少なくとも1,000時間のコンテンツが必要であり、それからユーザーを獲得し、市場を拡大することができる。今では3か月以内にそれが可能だ」と語った。
ドイツ市場では、このツールにより脚本家の出力能力が50%向上した。さらに、このツールは、より少ないミスを持つドラフトを生み出し、オーディオシリーズのユーザー保持率を向上させた。
アメリカ市場では、これらの新AIツールによって作られたシリーズは再生時間の10%を占めている。これらのシリーズは過去12か月で700万ドルの収益を上げており、制作コストを2〜3倍削減した。
コンテンツ生成技術の拡大
異なるAI機能を採用することで、ポケットFMはコンテンツの規模を迅速に拡大できる。同社は毎月約1,000の試聴回をリリースしており、膨大な数のコンテンツによっていくつかがヒット作品になる可能性がある。
しかし、音声番組はその一部に過ぎない。同社はすでに、ストーリーをコミックに変換するツールを開発しており、これをポケット・トゥーンズプラットフォームで使用している。ナヤク氏は、動画も会社が探求する形式の一つであると述べている。この1億9,600万ドル以上の資金調達を成功させたスタートアップ企業は、ミニシリーズアプリケーションの実験も行っている。
来年には、ポケットFMは独自の大型言語モデル(LLM)をリリースする予定である。このモデルは、同社の番組から収集したデータに基づき、ライティング補助、翻訳、ドラマティック化、ストーリーの文脈保持などの異なるツールを統合する。会社側は、独自のLLMに切り替えることで、個々の機能ごとに大量の小規模モデルをトレーニングする必要はなくなると述べている。
AI利用の潜在的な悪影響
AI技術の採用には副作用も生じている。ポケットFMは過去12か月間、複数のラウンドのリストラを実施しており、従業員や請負業者にも影響を与えている。また、脚本家の収入が時間が経つにつれて減少したという報告もある。同社はカリフォルニア州で雇用と給与に関する訴訟に直面している。
この点について、会社の代表は次のように述べた。「ほとんどのコンテンツ指向業界と同様に、私たちは多様な脚本家、声優、制作パートナーのネットワークとプロジェクトごとに協力しており、各市場に合わせてリソースを調整しています。AIは私たちの核心的なクリエイティブコミュニティへの影響は小さく、むしろカバー範囲と出力を広げる新しい道を開きました。」
品質の問題も注目されている。同社は視聴率の数字を使って品質を測定している。基本的な考え方は、新しいAIツールが独立したクリエイターにとって脚本室の役割を果たし、彼らが迅速に多くのコンテンツを作成できるということである。データに基づいて、脚本家はAIの助けを借りてストーリーを迅速に編集できる。しかし、これらのツールは「AIのゴミコンテンツ」つまり低品質なAI生成コンテンツをプラットフォームに導入する可能性があり、ユーザーの推薦に影響を与える恐れがある。それにより、良いストーリーを見つけるのが難しくなる可能性がある。
ポケットFMは、しっかりとした構造を持つストーリーが人気を博すと主張している。AIが手伝っても同じである。同社は、すべてのコンテンツがAI駆動の審査フレームワークを通じて検査され、品質と独自性が確保されていると述べている。また、AIによる審査が重複、著作権問題、コンテンツの健全性、その他の品質指標をチェックし、その後オーディオの公開を承認すると言っている。各エピソードは同等に宣伝され、最終的にはユーザーの参加度がエピソードのランク付けを決定する。
もう一つの懸念は、脚本家が時間とともにAIに過度に依存してしまうことである。ドイツでは、ある特定の番組ではAIが人間よりも多くの内容を書いた。ポケットFMがより多くのAIツールをリリースする計画を持っていることを考えれば、AIで書かれた内容の量は増えるだろう。それに伴って、より多くのエピソードを生み出すことが期待される。ユーザーの利用率が急速に上昇しなければ、平均的な収益が低下する可能性がある。
同社は収益に関する質問には直接回答しなかったが、AIツールが脚本家の仕事の速度を速め、データと観客のフィードバックに基づいてエピソードを編集することを助けていると述べた。つまり、彼らは全体的な再書き換えではなく、特定の改善を行うことができる。