微軟推出 GeoMap-Bench，助力地質圖理解的智能化

在地質科學領域，地質圖是理解地球表面及地下結構的關鍵工具。然而，解讀這些複雜的圖表需要專業知識和豐富的經驗。爲了提升這一領域的智能化水平，微軟亞洲研究院近日推出了一個新基準集 GeoMap-Bench，專門用於評估多模態大語言模型（MLLMs）在地質圖理解方面的表現。

GeoMap-Bench 的推出標誌着地質圖解讀的人工智能應用邁出了重要一步。微軟研究人員與中國地質科學院及武漢大學的專家深入探討，確定了地質圖理解所需的五大關鍵能力:信息提取、定位、指代、推理和分析。這些能力涵蓋了從獲取基本信息到執行復雜邏輯任務的多個方面，確保 AI 能夠全面理解地質圖。

研究人員利用超過7000幅地質圖創建了 GeoMap-Bench，生成了3000多個帶有標準答案的問題，以此評估現有的多模態大模型在地質圖解讀中的侷限性。常見的挑戰包括高分辨率圖像的處理、專業領域知識的需求，以及多樣化的視覺表現。

爲了進一步推動地質圖的智能解析，微軟還研發了 GeoMap-Agent，這一智能體不僅具備數字化地質圖的能力，還在高分辨率圖像處理和領域知識應用上進行了顯著改進。GeoMap-Agent 的架構包含三個核心模塊:層級信息提取、領域知識注入和增強提示問答，這些模塊的結合使得 AI 能夠高效、準確地分析複雜的地質信息。

研究人員表示，GeoMap-Bench 和 GeoMap-Agent 的推出，不僅爲地質學領域的 AI 應用提供了新的研究基礎，也將極大地推動地質信息的數字化和智能化，爲更廣泛的領域如災害預警和資源勘探等帶來深遠影響。

騰訊發佈OpenSearch-VL：開源多模態深度搜索 agent 的“全家桶”方案

騰訊混元聯合UCLA、港中文等機構，針對多模態大語言模型（MLLMs）從“被動理解”向“主動推理”進化的需求，開源了多模態搜索智能體。此前，高質量數據、自動化軌跡合成路徑及訓練配方的缺失，導致頂尖智能體難以復現。此次開源旨在打破僵局，推動社區發展。

DeepSeek V4下週發佈:原生支持影音圖文生成，適配國產算力

深度求索將於下週發佈多模態大模型V4，原生支持圖像、視頻與文本生成，旨在填補國內高性能低成本開源多模態模型市場空白。這是繼1月發佈R1推理模型後的首次重大更新。發佈初期將提供簡要技術說明，一個月後公開詳細工程報告。V4模型已與華爲、寒武紀完成底層生態合作。

DeepSeek V4 發佈在即！全新多模態模型讓 AI 生成更智能

深度求索將於下週推出多模態大模型DeepSeek V4，原生支持圖像、視頻和文本生成。這是繼今年1月發佈R1推理模型後的首次重大更新，旨在滿足國內對低成本開源模型的需求，推動AI發展。同時將發佈簡要技術說明，詳細版本預計一個月後推出。

微軟推出 GeoMap-Bench，助力地質圖理解的智能化

相關推薦

字節跳動聯合港科大發布MMProLong：長文檔LMM訓練問答對效率遠超OCR轉錄

騰訊混元等聯合發佈首個古文字OCR評測基準 Chronicles-OCR

騰訊發佈OpenSearch-VL：開源多模態深度搜索 agent 的“全家桶”方案

DeepSeek V4下週發佈:原生支持影音圖文生成，適配國產算力

DeepSeek V4 發佈在即！全新多模態模型讓 AI 生成更智能