AIで生成された画像がますますリアルになるにつれ、多くの人が動画視聴中に「これは本当に実写なのか?それともAIの作品なのか?」と考えるようになりました。
最近、bilibiliで「量子位」がAIでAI動画を識別する方法を探求した作品を発表し、大きな話題となり、再生回数は瞬く間に168万回を突破しました。AIがどのようにAIを「識別」するのか、見ていきましょう。
動画では、AI動画を見分けるためのいくつかのコツが紹介されています。例えば、人物の動きや表情が不自然ではないか、話し声、口の動き、感情が一致しているかなどに注意することです。しかし、膨大な数の動画を相手に、人海戦術では明らかに対応できません。そこでAIの出番となります。
AIによる顔交換動画の識別において、AIは独自の強みを持っています。AI顔交換技術は、通常、合成部分をフレームごとに元の動画に貼り付ける方法で行われます。「何かおかしい」と感じる程度の人間の目とは異なり、AIはこれらの「つなぎ目」を正確に特定できます。指紋が人それぞれ異なるように、動画の照明、テクスチャなどの情報は完璧に複製することは難しく、これらの微妙な違いがAI識別の鍵となります。
AIで完全に生成された動画の場合、識別方法はさらに複雑になります。ある研究チームは、モデルの特徴、運動の特徴、幾何学的単眼深度の特徴という3つの次元からアプローチし、3つの分類器を訓練しました。Soraで生成された動画を例にとると、人物や動物の数の不安定さ、物体の動きにおける色や影の異常な変化、そして撮影時の透視図や比率の誤差などが、AI識別の重要な手がかりとなっています。
さらに興味深いことに、研究者たちはDIVIDと呼ばれる新しい方法を発見しました。AI動画と実写動画を拡散モデルにそれぞれ再生成させると、結果が大きく異なることを発見しました。AIで生成された動画のピクセルは、トレーニングデータの平均値により近い傾向がある一方、人間が制作した動画はあらゆる面で明確な個性を見せています。この特性に基づいて開発されたDIVIDアルゴリズムは、Soraで生成された動画の識別において、93.7%の高い精度を達成しました。
これらのAI識別方法の登場は、虚偽情報の拡散に対抗するための強力な武器となります。これらは、デジタル世界における「火眼金睛」のようなものであり、情報海洋の中で真偽を見分ける手助けとなります。