在地質科學領域,地質圖是理解地球表面及地下結構的關鍵工具。然而,解讀這些複雜的圖表需要專業知識和豐富的經驗。爲了提升這一領域的智能化水平,微軟亞洲研究院近日推出了一個新基準集 GeoMap-Bench,專門用於評估多模態大語言模型(MLLMs)在地質圖理解方面的表現。

GeoMap-Bench 的推出標誌着地質圖解讀的人工智能應用邁出了重要一步。微軟研究人員與中國地質科學院及武漢大學的專家深入探討,確定了地質圖理解所需的五大關鍵能力:信息提取、定位、指代、推理和分析。這些能力涵蓋了從獲取基本信息到執行復雜邏輯任務的多個方面,確保 AI 能夠全面理解地質圖。

image.png

研究人員利用超過7000幅地質圖創建了 GeoMap-Bench,生成了3000多個帶有標準答案的問題,以此評估現有的多模態大模型在地質圖解讀中的侷限性。常見的挑戰包括高分辨率圖像的處理、專業領域知識的需求,以及多樣化的視覺表現。

image.png

爲了進一步推動地質圖的智能解析,微軟還研發了 GeoMap-Agent,這一智能體不僅具備數字化地質圖的能力,還在高分辨率圖像處理和領域知識應用上進行了顯著改進。GeoMap-Agent 的架構包含三個核心模塊:層級信息提取、領域知識注入和增強提示問答,這些模塊的結合使得 AI 能夠高效、準確地分析複雜的地質信息。

研究人員表示,GeoMap-Bench 和 GeoMap-Agent 的推出,不僅爲地質學領域的 AI 應用提供了新的研究基礎,也將極大地推動地質信息的數字化和智能化,爲更廣泛的領域如災害預警和資源勘探等帶來深遠影響。