グーグル DeepMindがデカップリング型のDiLoCoを発表：非同期トレーニングアーキテクチャを向上し、ハードウェア障害に耐性を高める

グーグルのDeepMindは最近、「デカップルされたDiLoCo」と呼ばれる新しい分散トレーニングアーキテクチャをリリースしました。このイノベーションは、大規模なAIモデルのトレーニング効率を向上させ、ハードウェア障害時のロバスト性を強化することを目的としています。

従来のトレーニング方法では、すべての計算ユニットが勾配更新時に厳密に同期する必要があり、これは単一のハードウェア障害によって全体のプロセスに影響を与える可能性があります。この問題を解決するために、デカップルされたDiLoCoはトレーニングプロセスを複数の非同期で故障隔離された「計算孤島」に分散し、それぞれの計算ユニットが他のユニットを待たずに独自にトレーニングを行うことができます。

このアーキテクチャのコアは、トレーニングタスクを「学習ユニット」と呼ばれるクラスタに割り当てることです。各学習ユニットはローカルで複数回の勾配計算を行い、その後圧縮された勾配情報を外部オプティマイザに送信して集約します。このプロセスは非同期であるため、あるユニットが障害を起こしても、他のユニットは引き続きトレーニングを続けることができ、従来の方法のように単一の障害ポイントによる全体の停止を防ぐことができます。

実験により、デカップルされたDiLoCoは高いハードウェア障害率でも88%の良好な利用率を維持できることが確認され、標準的なデータ並列トレーニング方法ではわずか27%にとどまります。さらに、この新アーキテクチャはデータセンター間の帯域幅を198 Gbpsから大幅に0.84 Gbpsに削減し、現在の商業的なインターネットインフラストラクチャでのグローバルな分散トレーニングを可能にしています。

注目すべき点は、デカップルされたDiLoCoには自己治癒機能があることです。混沌工学テストにおいて、システムはすべての学習ユニットが失敗した後もトレーニングを継続でき、ユニットが復元された後にはスムーズに再統合できます。このような柔軟性はさまざまなハードウェアプラットフォームで同様に適用され、異なる世代のTPUチップが一度のトレーニングで協働できるようにし、古い機器の寿命を延ばし、ハードウェア更新中の容量のボトルネックを緩和します。

要点：
🌟 デカップルされたDiLoCoは、トレーニングタスクを複数の非同期学習ユニットに分散することで、大規模モデルトレーニングのロバスト性を高めています。
🌐 このアーキテクチャはデータセンター間の帯域幅需要を0.84 Gbpsにまで低下させ、グローバルな分散トレーニングをより現実的にしています。
🔧 自己治癒機能を持つデカップルされたDiLoCoは、ハードウェア障害の状況下でも効率的なトレーニングを維持し、異種ハードウェアの混合使用をサポートしています。

ボストン・ダイナミクスのロボット犬 Spot の新アップグレード：GoogleのGeminiモデル搭載

ボストン・ダイナミクスとGoogle DeepMindは協力して、Gemini Robotics-ER1.6 AIモデルをSpotロボットに統合し、産業検査における能力を大幅に向上させました。特にリークの識別やメーターのデータ読み取りにおいて、ロボットの自律的な意思決定能力が強化されました。

Google DeepMindがLyria 3 Proを発表：AI音楽は30秒の試聴から完成した曲に進化

Google DeepMindが新たにリリースしたLyria 3 Proモデルは、音楽生成の時間長を30秒から3分まで大幅に改善し、「構造認識」機能を追加しました。これにより、モデルはイントロ、ボーカル、サビなど、完全な構造を持つ曲を理解し生成できるようになり、以前の背景音効果のみを生成する制限を突破しました。

グーグル GDC 2026で明らかにされた：Genie 3が生成したゲーム世界は数分でクラッシュ

2026年のGDCで、グーグル・ディープマインドは生成型AIモデルのGenie3を紹介しました。このモデルは対話コンテンツの自動生成を目指しています。研究チームは冷静に指摘しました。現在のAIによるゲーム世界には一貫性がなく、数分も経つと大規模な論理エラーと画面上のクラッシュが発生しています。現地の観察によると、ゲーム体験は最初の60秒だけがスムーズで、その後環境の整合性が急速に崩れていきます。

AI大手企業の社員が陣取る：OpenAIとDeepMindの研究者らがAnthropicを支持し、五角庁との対立に加わる

30人以上のOpenAIおよびGoogle DeepMindの従業員が、米国防省を相手にアンソニックを訴えたことに対して支援を表明し、同社をサプライチェーンリスクとして指定することを反対。この行動は権力の乱用であり、AI産業の発展に害を及ぼすと指摘している。

GoogleがGemini3.1Flash-Liteを発表：性能が前バージョンを大幅に上回り、出力価格が3倍にアップ