Google DeepMindがGenie 2を発表、ワンクリックで無限の仮想世界を生成

Google DeepMindが最近発表したGenie2は、その驚異的な世界生成能力により、AIのトレーニングとインタラクションの可能性を再定義しつつあります。

Genie2は革新的な基礎世界モデルであり、自然言語による指示で、多様性が高く論理的に整合性のある仮想世界をリアルタイムで生成できます。このモデル最大のハイライトは、複雑な3D環境を作成できるだけでなく、ユーザーやAIエージェントが1分間もの間インタラクションできる点です。

この「仮想世界ジェネレーター」は、幅広い用途が考えられます。迷路、自然風景、人間社会環境のシミュレーションなど、Genie2は正確に生成できます。AIトレーニングにおいては、ロボットやバーチャルアシスタントなどの分野で革命的な影響をもたらす、無限に多様で挑戦的な学習環境を構築できることを意味します。

Genie2が示す能力は注目に値します。操作コントロールのインテリジェントな認識、反実仮想シナリオの生成、見えない世界の記憶、動的なコンテンツ作成、そして複雑な物理現象のシミュレーションが可能です。水の流れ、煙、重力から光の反射まで、Genie2は現実世界のほぼすべての重要な物理的特徴を網羅しています。

さらにエキサイティングなのは、このモデルは単一の画像プロンプトから始め、キーボードとマウスの入力によって、インタラクティブな世界を迅速に構築できることです。研究者たちは、現実世界の画像を起点として、生き生きとした仮想シーンを生成することもできます。

Genie2はまだ初期の研究段階にありますが、Google DeepMindの研究チームは、この技術がより汎用的なAIシステムのトレーニングへの道を切り開くと確信しています。よりスマートなAIエージェントの開発を支援するだけでなく、将来のクリエイティブワークフローにも全く新しい可能性を提供します。

このブレークスルーは技術の勝利であるだけでなく、AIがよりオープンで創造的な方向へ発展する重要なマイルストーンでもあります。私たちは、全く新しいAI世界生成時代の幕開けを目撃しているのです。

詳細：https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/

米国政府とテクノロジー企業が合意を締結 AIモデルの国家安全保障上のリスクを評価

米国政府はグーグルDeepMind、マイクロソフト、xAIなどのテクノロジー企業と協定を結び、新たなAIモデルの公開前に早期審査を実施する。商務省傘下のAI標準革新センター（CAISI）が主導し、最先端AI技術の能力と国家安全保障のバランスを図る。CAISI所長クリ氏は、審査プロセスが技術の潜在的影響を理解する上で極めて重要と強調。....

グーグル DeepMindがデカップリング型のDiLoCoを発表：非同期トレーニングアーキテクチャを向上し、ハードウェア障害に耐性を高める

Google DeepMindは、大規模AIモデルの訓練効率を向上させ、ハードウェア障害への耐性を強化するため、訓練プロセスを複数の非同期で障害分離された「計算孤島」に分散するDiLoCo分散訓練アーキテクチャを発表した。これにより、従来の密な同期方式が単一障害点の影響を受けやすいという制限を克服する。....

ボストン・ダイナミクスのロボット犬 Spot の新アップグレード：GoogleのGeminiモデル搭載

ボストン・ダイナミクスとGoogle DeepMindは協力して、Gemini Robotics-ER1.6 AIモデルをSpotロボットに統合し、産業検査における能力を大幅に向上させました。特にリークの識別やメーターのデータ読み取りにおいて、ロボットの自律的な意思決定能力が強化されました。

Google DeepMindがLyria 3 Proを発表：AI音楽は30秒の試聴から完成した曲に進化

Google DeepMindが新たにリリースしたLyria 3 Proモデルは、音楽生成の時間長を30秒から3分まで大幅に改善し、「構造認識」機能を追加しました。これにより、モデルはイントロ、ボーカル、サビなど、完全な構造を持つ曲を理解し生成できるようになり、以前の背景音効果のみを生成する制限を突破しました。

グーグル GDC 2026で明らかにされた：Genie 3が生成したゲーム世界は数分でクラッシュ