グーグルDeepMind、GeminiとVeoを統合した万能インテリジェントアシスタントを計画

AI分野で常に革新を続けるGoogleは、先日、エキサイティングな計画を発表しました。Google DeepMindのCEOであるDemis Hassabis氏は、Podcast番組「Possible」で、同社のGemini AIモデルとVeo動画生成モデルを統合する計画を明らかにしました。この取り組みは、Geminiの物理世界に対する理解能力を高め、現実世界でユーザーを支援できる真の汎用デジタルアシスタントの開発を目指しています。

Hassabis氏は、Geminiモデルは当初から、様々な種類データや情報を処理できるマルチモーダルシステムとして設計されたと述べています。「私たちのビジョンは、様々なメディア形式を統合できるアシスタントを構築することで、世界をより深く理解し、世界とやり取りできるようにすることです。」と彼は言及しました。現在、Geminiモデルは画像、テキスト、音声の生成が可能であり、強力なマルチモーダル能力を示しています。

注目すべきは、AI業界全体が「万能」モデルへと向かっていることであり、多くの企業が同様の方向性を模索しています。例えば、OpenAIのChatGPTはテキスト会話の処理だけでなく、芸術的なスタイルの画像も生成できます。さらに、Amazonも全く新しい「任意から任意」のモデルを発表する予定で、より高度なマルチモーダル機能の実現を目指しています。

Hassabis氏は、Veoモデルのトレーニングデータは主にGoogle傘下のYouTubeプラットフォームから取得されたと明かしました。大量のYouTube動画を分析することで、Veoは世界の物理法則を効果的に学習できます。「Veo2は大量の動画を見ることで、現実世界の仕組みをより深く理解できるようになります。」と彼は述べています。これは、Veoのトレーニングで使用されるデータが豊富で、実用的な価値を持つことを示しています。

Googleは昨年、AIモデルのトレーニングに使用するYouTubeコンテンツを増やすため、サービス利用規約を拡大しており、モデルの多様性と正確性を確保しています。このようなデータ取得戦略は、GeminiとVeoの統合に堅実な基盤を提供し、間もなく登場するスマートアシスタントがユーザーのニーズをより包括的かつ深く理解し、応答できるようにします。

技術の進歩に伴い、Googleのこの計画は、AIアシスタントが単一タスクに限定されなくなることを示唆しており、複数の分野で実用的なサポートを提供し、ユーザーの生活にさらなる利便性をもたらすでしょう。

iPhoneでもGeminiが使えるようになりました！グーグルアルバムのAIクリエーション機能がiOSプラットフォームに正式リリース

グーグルは「AI Creations」機能をiOSプラットフォームへ拡張しました。ユーザーはGemini AIを使用して通常の写真をアート作品に変換できます。この機能にはさまざまなテンプレートがあり、写真の中心となるものをスマートに認識し、プロフェッショナルな肖像画やアニメキャラクターなど異なるスタイルに統合することで、創造的な表現を向上させます。

世界初の本格的な参照システム：カーリンAI3.0が正式リリース。15秒の長動画でAIディレクター時代を始動

快手可灵AIが3.0にバージョンアップし、マルチモーダル入出力でAI動画制作のワークフローを刷新。「誰もが監督になれる」時代を推進。中核的な進歩は、動画生成が「断片生成」から「深層ナラティブ」へ進化し、世界初の複数画像/動画主体参照機能で、クリエイターが動画の主体を正確に固定・制御できるようになった点です。....

DeepMindとAnthropicのCEOが警告：入門レベルの職種が削減される危機に階層下位の白領職は半減する恐れ

グーグルDeepMindとAnthropicのCEOは、AIが企業内の初級職を実際に置き換える段階に入っていると述べた。DeepMindの責任者は、2026年がAIによる初級職への影響の元年となると予測し、採用が鈍化しており、入門者やインターンシップの職種が最初に影響を受けると語った。

アマゾンが Nova 2 シリーズモデルを発表し、AI性能が新たな高みに達しました！

AWSはre:Invent2025で自社開発の多モーダル大規模モデル「Nova2」シリーズ4機種を発表。テキスト、画像、動画、音声に対応し、初めてウェブ検索とコード実行機能を内蔵。コストパフォーマンスで業界をリードすると主張。Nova2 Liteは高コスパ推論に特化し、Claude Haiku4.5やGPT-5Miniを性能で上回りつつコストは約50%。Nova2 Proは複雑なエージェントタスク向け。....

グーグルDeepMind、GeminiとVeoを統合した万能インテリジェントアシスタントを計画

関連推奨

iPhoneでもGeminiが使えるようになりました！グーグルアルバムのAIクリエーション機能がiOSプラットフォームに正式リリース

世界初の本格的な参照システム：カーリンAI3.0が正式リリース。15秒の長動画でAIディレクター時代を始動

米運輸省、Google Geminiを導入し、安全規則の作成を迅速化する方針

DeepMindとAnthropicのCEOが警告：入門レベルの職種が削減される危機に階層下位の白領職は半減する恐れ

アマゾンが Nova 2 シリーズモデルを発表し、AI性能が新たな高みに達しました！

グーグルDeepMind、GeminiとVeoを統合した万能インテリジェントアシスタントを計画

関連推奨

iPhoneでもGeminiが使えるようになりました！グーグルアルバムのAIクリエーション機能がiOSプラットフォームに正式リリース

世界初の本格的な参照システム：カーリンAI3.0が正式リリース。15秒の長動画でAIディレクター時代を始動

米運輸省、Google Geminiを導入し、安全規則の作成を迅速化する方針

DeepMindとAnthropicのCEOが警告：入門レベルの職種が削減される危機に 階層下位の白領職は半減する恐れ

アマゾンが Nova 2 シリーズモデルを発表し、AI性能が新たな高みに達しました！

DeepMindとAnthropicのCEOが警告：入門レベルの職種が削減される危機に階層下位の白領職は半減する恐れ