グーグルのVidsにVeo3.1モデルを統合し、テキストの指示によりAIの仮想キャラクターとインタラクティブに操作可能

グーグルは4月2日に、企業向けのビデオクリエイションアプリ「Vids」に大きなアップデートを導入することを発表しました。Veo3.1動画生成モデルと自然言語インタラクション技術を統合することで、静的な生成から動的な「指示制御」への飛躍を実現しています。このアップデートの核となるのは、AI仮想キャラクターに強力な対話能力を付与することです。ユーザーは簡単なテキストのヒントを入力するだけで、キャラクターがシーン内で製品、小物、または機器と特定のインタラクションを行うように指示でき、動的な出力においてもキャラクターの視覚の一貫性を維持できます。

また、Vidsは多モーダル機能をさらに統合し、最近導入されたLyria3シリーズの音声モデルの上に、Veo3.1の導入により8秒間の動画セグメントを生成できるようになりました。一般ユーザーおよび企業の高価格プランアカウントにはそれぞれ月10回〜1000回までの生成枠が提供されています。

ワークフローの閉鎖を実現するために、Google VidsはYouTubeへの直接エクスポート機能を追加し、新規のChrome録画拡張機能と組み合わせて、素材の取得から完成品の配信に至るまで一連のプロセスを構築しました。

一方で、人工知能分野の競争状況は日々激化しており、マイクロソフトは同日、MAIシリーズの3つのベースモデルを発表しました。このモデル群は25種類の言語に対応し、音声トランスクリプション、音声生成、および動画生成の能力を備えており、より低コストでグーグルやOpenAIの市場地位に挑戦する狙いがあります。

グーグルは2024年にVidsをリリースして以来、3Dアニメキャラクターや複数言語対応の迅速な進化を遂げました。このようなプロンプトに基づく精密なコントロール機能は、AI動画ツールが単純なコンテンツ生成からより専門的な深さを持つ自動演出段階へと進化していることを示しており、企業のコンテンツ制作のコスト構造とクリエイティブな境界をさらに変革していくことになります。

グーグルVeo 3.1の大規模アップデート！複数画像の整合性を最大限に引き上げ、縦型出力と4Kスーパークリーン機能を追加

Google DeepMindが提供するAIビデオ生成モデルであるVeo3.1は重要なアップデートを実施しました。特に「Ingredients to Video」機能の中心的な最適化により、人物や物体、テクスチャ、背景の整合性が大幅に向上しました。また、ナチュラルな縦型出力およびプロフェッショナルレベルの4Kスーパークリーン機能が追加され、AIビデオが見せものから実用的な生産ツールへと進化しました。

Googleの動画編集プラットフォームVidsに新機能が全員に開放され、AI音声ナレーション、余分な会話の削除、AI画像編集などが含まれます

Googleの動画編集プラットフォーム「Vids」が全ユーザーにAI機能を無料開放。音声ナレーション、不要な口語の自動削除、画像編集などを提供。動画をアップロードするだけで、システムが自動的に冗長な内容を識別・簡素化します。....

Gemini Veo 3.1が複数の画像を参照にした機能を追加してリリース、一度に3つの要素を合成して動画を作成

GoogleのGemini Pro/Ultraサブスクリプションユーザーは現在、Veo3.1ビデオモデルを体験できます。新機能「Ingredients to Video」により、同時に3枚の参照画像をアップロードし、それぞれ人物、背景、スタイルの特徴を抽出して統合して8秒間の1080p動画を作成することが可能です。生成されたコンテンツにはSynthIDの透過 Wasserzeichenが付いており、ウェブやモバイル端末でテキスト入力から一括で作成できます。システムはフレームごとのキャラクターの一貫性と光の連続性を確保しており、演示例では3枚のセルフカメラ画像＋サイバーカイロの背景＋油絵風の画像を使用しています

グーグルのVidsにVeo3.1モデルを統合し、テキストの指示によりAIの仮想キャラクターとインタラクティブに操作可能

関連推奨

グーグルがAIビデオツール「Flow」のアクセス権を拡大：縦画面と8秒間の4K生成に対応

グーグルVeo 3.1の大規模アップデート！複数画像の整合性を最大限に引き上げ、縦型出力と4Kスーパークリーン機能を追加

グーグルがVeo3.1の大規模アップデートを公開: オリジナルの縦型動画によるAI創作がYouTube Shortsに直接投稿可能

Googleの動画編集プラットフォームVidsに新機能が全員に開放され、AI音声ナレーション、余分な会話の削除、AI画像編集などが含まれます

Gemini Veo 3.1が複数の画像を参照にした機能を追加してリリース、一度に3つの要素を合成して動画を作成