在2025年Google I/O開發者大會上,谷歌正式發佈輕量級多模態模型Gemma3n,並宣佈Gemma模型家族持續擴展,新增面向醫療和無障礙場景的MedGemma與SignGemma。
作爲本地運行AI趨勢的代表,Gemma3n專爲手機、筆記本和平板等低算力設備設計,具備處理文本、音頻、圖像和視頻的能力。據谷歌介紹,Gemma3n甚至可在低於2GB運行內存的設備上流暢運行,體現出其高效架構優勢。該模型已於發佈日面向開發者預覽,並與Gemini Nano共享底層架構。

谷歌強調,Gemma3n的輕量與隱私優勢,使其成爲離線AI應用的理想選擇。相比需要依賴雲端的大型模型,本地AI模型不僅響應更快、成本更低,還能保護用戶數據不被傳輸至遠程服務器,尤其適用於隱私敏感型場景。
在健康領域,谷歌通過旗下健康AI開發者基金會,推出了MedGemma——一組針對健康相關文本與圖像的開放模型。據介紹,MedGemma具備出色的多模態分析能力,支持開發者在醫療影像識別、病歷文本處理等場景中構建更精準的AI工具。
此外,谷歌還預告了即將推出的SignGemma模型,專爲手語識別而設計,能夠將美國手語(ASL)翻譯成英語文本,旨在幫助開發者爲聾啞與聽障用戶構建更友好的溝通工具。谷歌表示,這是“目前爲止最強大的手語理解模型”。
儘管Gemma模型系列因其非標準許可條款引發部分開發者對商業化使用的擔憂,但其廣泛的功能性仍獲得開發者社區熱烈響應,Gemma模型系列的下載量已突破數千萬次。
隨着Gemma模型家族不斷拓展,谷歌正推動開放AI模型在設備端、本地隱私保護、醫療健康與無障礙領域邁向更廣闊的應用空間。
