グーグルのDeepMindは、最近「AlphaEarth Foundations」という人工知能システムをリリースしました。このシステムは、膨大な衛星データを統一されたデジタル表現に変換し、環境分析の正確性を向上させ、食料安全保障、森林伐採、水資源などの問題に対する意思決定を支援することを目的としています。AlphaEarth Foundationsは、「仮想衛星」と見なすことができ、地球のすべての陸地と沿岸水域を10x10メートルの解像度で描写します。
このモデルは、光学衛星画像、レーダー、3Dレーザースキャニング、気候シミュレーションなど複数のデータソースを統合しています。これらの入力データを64次元の埋め込み(embedding)に圧縮することで、DeepMindはデータの効率的な表現を実現しました。トレーニング中に、AlphaEarth Foundationsは世界中で50万以上の場所から30億を超える観測データを使用し、Sentinel-2やLandsatなどの衛星ミッションだけでなく、ウィキペディアの記事や種の観察などのテキスト情報も含んでいます。
このシステムの目標は、データ過多と情報の不一致という2つの主要な課題に対処することです。AlphaEarth Foundationsは連続した雲層を透過して南極大陸の複雑な地表を描写し、カナダの小麦栽培における小さな変化を明らかにし、これらは人間の目では捉えられない細かい点です。伝統的な方法や他のAI描画システムとの比較テストにおいて、AlphaEarth Foundationsの誤り率は平均で24%低かった。このモデルは、土地利用分類、生物物理的変数の推定、変化検出などの15個の評価データセットで優れた性能を発揮しています。
AlphaEarth Foundationsは、データが不足している状況でも効果的に動作できます。継続的な時間分析機能により、システムは完全に整合しない時間帯でも正確な予測を行うことができます。このモデルの「時空間精度」(STP)アーキテクチャでは、同じ場所の異なる時期の衛星画像を動画のフレームのように扱い、これによりシステムは空間、時間、測定の関係を学習し、局所的な環境と時間の軌跡を捉えた埋め込み表現を生成します。
現在、50社以上の組織が現実世界での応用においてこのシステムをテストしています。グローバル・エコシステム・アトラス(Global Ecosystems Atlas)は、このデータを使って以前未マッピングだったエコシステムを分類し、沿岸の灌木林や超乾燥砂漠などを含みます。ブラジルのMapBiomasは、これらのデータを活用して農業と環境変化を深く分析し、特にアマゾン熱帯雨林などの重要なエコシステムについて研究しています。
さらに、グーグルはGoogle Earth Engine上で「Satellite Embedding Dataset」という年次埋め込みデータセットを公開する予定です。Google Earth Engineのデータによると、このデータセットは毎年1.4兆を超える埋め込みフットプリントを生成し、グローバルな類似環境条件の識別、変化検出、自動クラスタリング、よりスマートな分類などのさまざまな応用シーンを提供します。
科学研究の加速を目的として、グーグルは最大5,000ドルの研究助成金を提供し、衛星埋め込みに基づく応用ケース研究をサポートしています。DeepMindの開発チームは、AlphaEarth Foundationsが私たちが変化する惑星の状態とダイナミクスを理解する上で重要な一歩であると考えており、汎用推論の大型言語モデル(LLM)と組み合わせて、より強力なアプリケーションを作り出すことを期待しています。
ポイント:
🌍 AlphaEarth Foundationsは、グーグルDeepMindが開発した仮想衛星AIシステムで、10x10メートルの解像度で地球のすべての陸地と沿岸水域を描写します。
📊 このシステムは複数のデータソースを統合し、64次元の埋め込みにより効率的な表現を行い、環境モニタリングの正確性を向上させ、平均して24%の誤差率低下を実現しています。
💡 グーグルは、グローバルな研究を支援するために、衛星埋め込みデータセットを公開し、科学的应用を促進するための研究助成金を提供します。