近日,公司正式發佈新一代開源醫療大模型 MedGemma 1.5,並在同期推出專爲臨牀場景設計的開源語音識別模型 MedASR,進一步完善其在醫療垂直領域的技術棧。
作爲Gemma系列的醫療專用版本,MedGemma 1.5 在前代基礎上顯著增強了對醫學影像的理解與分析能力。該模型不僅能處理文本病歷、檢驗報告和醫學文獻,還可結合X光、CT等常見影像模態的描述性數據,輔助進行初步篩查與診斷推理。這一升級使MedGemma從純文本問答工具,邁向多模態臨牀決策支持系統,更貼近真實醫療工作流。
與此同時,MedASR 的推出直擊醫生文書負擔痛點。該模型專爲醫療語音場景優化,能高精度識別醫患對話、查房記錄、手術口述等專業內容,並自動轉寫爲結構化文本,大幅提升電子病歷錄入效率。谷歌強調,兩個模型均基於去標識化的臨牀數據訓練,嚴格遵循隱私保護規範,並以開源形式發佈,供全球研究者與開發者免費使用。
此次雙模型發佈,標誌着谷歌在醫療AI領域從“封閉服務”向“開放賦能”戰略的深化。繼Gemini醫療助手通過HIPAA合規認證後,開源模型的推出將進一步降低醫療機構、初創公司及學術團隊的創新門檻,推動AI在基層醫療、遠程診療和科研分析等場景的普惠應用。
在AI醫療從“可用”走向“好用”的關鍵階段,谷歌正以開源+合規+多模態的組合拳,構建一個兼具安全性、實用性與可擴展性的醫療AI生態底座。
