TikTok は最近、動画の自動テキスト要約を目的とした実験的な人工知能機能のテストを停止し、そのツールの開発の重点を特定の分野に移すことを発表しました。米国などの市場で数か月間小規模にテストされた「AI Overviews(AI概要)」機能は、もともとTikTok独自またはサードパーティのマルチモーダルモデルを使って、ユーザーに動画の背景情報や製品推薦を提供することを目的としていました。

抖音,TikTok

しかし、実際に使用した結果、この機能が示した深刻な「幻覚(hallucination)」が広く注目されました。例えば、有名クリエイターのCharli D'Amelioの映像を「ブルーベリーの異なる材料の集まり」と認識し、犬のトレーニング動画を「折り紙芸術」と誤解するなど、夏ヒラのプロモーションビデオを「移動する青い形」と表現するなど、さまざまな誤解が起こりました。

TikTokの担当者は、アルゴリズムの理解能力の著しいずれ違いに対応するために、関連するテストをフィードバックに基づいて中止し、今後は動画内の具体的な製品の識別に焦点を当てることを確認しています。これにより、現在の生成型AIが動的視覚情報を処理する際には、論理的な関連性の欠如や意味の誤認識といった技術的な課題に直面していることがわかります。

この出来事は、グーグルの「ペッパーサラダ(ガム付きピザ)」に次ぐもう一つの典型的なAI幻覚の例と見なされています。グーグルなどの大手企業のAI概要の正確率が最近改善されているというデータがあるものの、TikTokの失敗は、高密度で構造化されていないコンテンツ生態系であるショートビデオにおいて、マルチモーダル大規模モデルの汎化能力が依然として高信頼性の自動物語構築には十分ではないことを再び警告しています。短期的には、業界は「万能な説明」を目指す代わりに、「垂直アプリケーション」への焦点を絞り、認知の境界を狭めることで、AIツールの実用価値とビジネスの確実性を向上させています。