グーグル DeepMind は、その先進的な AI 動画生成モデルである Veo に革命的な「正確な編集」機能を導入したことを発表しました。この機能は、シンプルなテキストの指示によって、既存の動画にアイテム、キャラクター、または背景のオブジェクトを簡単に追加または削除できるようにし、物理的リアリズムと視覚的な一貫性を確保しながら、シーンをスマートに再構築します。これにより、元の動画の完全性が完璧に保たれます。

AIbase の報道によると、今回のアップデートは AI 動画編集が粗放的な生成から精密な後処理へと転換するものであり、Flow プラットフォーム上のクリエイターの生産性を大幅に向上させます。Veo の正確な編集機能は、グーグルの AI 映画制作ツール Flow を専用として設計された Veo3.1 インターフェースの一部です。この機能は高度な生成型 AI アルゴリズムを使用しており、光の描写、比率、オブジェクトの相互作用、および動きの軌跡を考慮して、滑らかな修正を実現します。

例えば、ユーザーは「シーンに黄色いスクールバスを追加してください」とか「道路沿いの歩行者を削除してください」と指示することで、モデルは自動的にバックグラウンドを埋めたり、影を調整したり、カメラの動きの一貫性を維持したりします。従来の編集ソフトウェアでよく見られる「フレームジャンプ」や不自然な痕跡を避けることができます。デモ動画では、この機能は静止画から動的な複数ショットの物語への完全なプロセスを示しており、ユーザーは数秒でコンテンツを反復できます。撮影や手動マスクなしで可能です。

 AIbase の分析によると、Veo3.1 のコア革新には強化された音声同期、複数のヒントによるシーン生成、そしてネイティブな1080p出力が含まれており、動画の長さを1分まで拡張できます。これにより、正確な編集は短編クリエイターだけでなく、広告、マーケティング、および企業研修にも適用可能です。例えば、Flow では、ユーザーは「要素(例:事前に定義されたキャラクターやスタイルの参考)」をアップロードし、正確な編集でカットを拡張することで、単一のフレームから完全なストーリーボードへの自動化が可能になります。前のバージョンである VEO3 と比較すると、このバージョンではキャラクターの一貫性と物語制御が30%以上向上し、ベンチマークテストでは編集精度が95%に達し、OpenAI の Sora2 よりも顕著に優れています。「正確な編集により、AI 動画制作が本格的に民主化され、プロのスキルがなくてもハリウッド級の編集が可能です」と述べています。

DeepMind は公式ブログで、この機能が Flow の実験的なツールに統合されており、Google AI Pro および Ultra サブスクリプションユーザーが優先的にアクセスできると述べました。開発者は Vertex AI プラットフォームを通じて、カスタム音声やオブジェクト削除最適化などのエンタープライズアプリケーションのプレビューが可能です。以前、Veo は Imagen3 および Chirp3 モデルで類似の inpainting 機能を示しており、ビデオ AI の研究段階から本格的な運用段階への移行を推進しています。コンテンツクリエイターが効率的なツールを求める需要が急増している中、Veo の正確な編集はデジタルナラティブエコシステムを変革し、独立映画からソーシャルメディアのショートビデオに至るまで、すべての分野で恩恵を受けられることが期待されています。