谷歌 DeepMind 近日推出了名爲 AlphaEarth Foundations 的人工智能系統,該系統旨在將海量的衛星數據轉化爲統一的數字表示,以提高環境分析的準確性,支持食物安全、森林砍伐和水資源等問題的決策。AlphaEarth Foundations 可以被視作一種 “虛擬衛星”,它以每10x10米的分辨率對地球的所有陸地和沿海水域進行描繪。

image.png

這一模型整合了多種數據來源,包括光學衛星圖像、雷達、3D 激光測繪和氣候模擬。通過將這些輸入數據壓縮爲64維嵌入(embedding),DeepMind 實現了數據的高效表示。其訓練過程中,AlphaEarth Foundations 使用了來自全球超過500萬個地點的超過30億條觀測數據,數據來源涵蓋了 Sentinel-2和 Landsat 等衛星任務,還結合了維基百科文章和物種觀察等文本信息。

該系統的目標是解決數據過載和信息不一致的兩個核心挑戰。AlphaEarth Foundations 能夠穿透持續的雲層,繪製南極洲的複雜地表,並揭示加拿大小麥種植中的微小變化,這些細節是人眼所無法捕捉到的。在與傳統方法及其他 AI 繪圖系統的對比測試中,AlphaEarth Foundations 的錯誤率平均低了24%。該模型在土地利用分類、生物物理變量估算和變化檢測等15個評估數據集上表現優異。

AlphaEarth Foundations 還能夠在處理數據稀缺的情況下進行有效工作,其持續的時間分析功能使得系統可以對不完全對齊的時間段進行精確預測。該模型的 “時空精度”(STP)架構將來自同一地點的不同時期的衛星圖像視作視頻中的幀,這樣的處理方式使系統能夠學習空間、時間和測量之間的關係,從而生成捕捉局部環境和時間軌跡的嵌入表示。

目前,已有50多家組織在現實應用中測試這一系統。全球生態系統地圖(Global Ecosystems Atlas)利用該數據將以前未映射的生態系統分類,包括沿海灌叢和超乾旱沙漠等。巴西的 MapBiomas 則藉助這些數據深入分析農業和環境變化,尤其是亞馬遜雨林等關鍵生態系統。

此外,谷歌還將在 Google Earth Engine 上發佈名爲衛星嵌入數據集(Satellite Embedding Dataset)的年度嵌入數據。根據 Google Earth Engine 的數據,該數據集每年生成超過1.4萬億個嵌入足跡,爲識別全球相似環境條件、變化檢測、自動聚類和更智能的分類提供了多種應用場景。

爲了加速科學研究,谷歌還提供最高5000美元的研究資助,以支持基於衛星嵌入的應用案例研究。DeepMind 的開發團隊認爲,AlphaEarth Foundations 是理解我們不斷變化的星球狀態和動態的重要一步,並期待將其與通用推理大型語言模型(LLM)結合,創造出更強大的應用。

劃重點:  

🌍 AlphaEarth Foundations 是谷歌 DeepMind 推出的虛擬衛星 AI 系統,能夠以10x10米分辨率描繪地球的所有陸地和沿海水域。  

📊 該系統整合多種數據源,通過64維嵌入高效表示,提升環境監測的準確性,平均錯誤率降低24%。  

💡 谷歌將發佈衛星嵌入數據集,支持全球研究,並提供研究資助以促進科學應用。