グーグルは今日、Gemini Pro/Ultraサブスクリプションユーザーに対してVeo3.1ビデオモデルを配信し、「Ingredients to Video」モードを追加しました。このモードでは、同時に3枚の参照画像をアップロードでき、それぞれ人物、シーン、スタイルの特徴を抽出し、8秒間の1080pビデオに統合します。生成されたコンテンツにはSynthIDのインジゴウォーターマークが自動的に含まれます。ユーザーはウェブページまたはモバイル端末でテキストのプロンプトを入力すると、ワンクリックでビデオを作成できます。システムはフレーム間のキャラクターの一貫性と光の連続性を保持します。

111.jpg

グーグルのデモでは、3枚の異なる角度のセルフィー+サイバーカイロの背景+油絵風の画像を用いることで、「インプリマニズムの未来の街歩き」の短編映画を出力できることが示されました。顔と服の形は一切変化しません。Veo3.1は元の環境音も同時に出力し、最初と最後のフレームの制御や動画の延長機能をサポートしています。

グーグルは、複数の画像を参照する機能が完全に公開され、生成枠は現在のサブスクリプション枠と一致しており、追加の有料プランは発表されていません。