谷歌重磅發佈三大Gemma模型變體，AI醫療、手語翻譯與海豚語言解鎖新可能！

近日，谷歌在人工智能領域再掀波瀾，宣佈推出基於Gemma模型的三款全新變體:MedGemma、SignGemma和DolphinGemma。這些模型分別針對醫療、手語翻譯和海豚語言研究領域，展現了AI技術在跨領域應用的巨大潛力。以下，AIbase爲您詳細解讀這三款模型的亮點與應用前景。

MedGemma:革新醫療AI，助力精準診療

MedGemma是谷歌專爲醫療領域打造的AI模型，提供兩個版本以滿足不同需求。4B多模態模型能夠處理圖像與文本的組合任務，經過針對胸部X光片、皮膚科圖像、眼科圖像和病理切片等醫療數據的預訓練，展現了在醫療影像診斷、報告生成和患者分診等任務中的強大能力。27B文字推理模型則專注於純文本處理，憑藉更強的推理能力，適用於病歷分析、醫療問答等需要深入理解的場景。這兩款模型均可在單塊GPU上高效運行，爲醫療開發者提供了靈活的開發選擇。

谷歌表示，MedGemma通過其Health AI Developer Foundations計劃發佈，旨在加速醫療應用的開發。未來，開發者可利用這些模型構建更智能的醫療工具，爲精準醫療注入新動能。

SignGemma:打破溝通壁壘，手語翻譯更進一步

SignGemma是一款專爲手語翻譯設計的開放模型，重點支持美國手語（ASL）到英語的翻譯。這款模型能夠將手語動作轉化爲口語文本，爲聾病患者和開發者提供了全新的交互方式。據悉，SignGemma在手語理解方面表現卓越，被譽爲“迄今爲止最強大的手語理解模型”。

谷歌計劃在未來進一步擴展SignGemma的多語言支持，助力全球聾病社區實現無障礙溝通。開發者可基於此模型開發創新應用，例如實時手語翻譯工具或教育平臺，爲聾病羣體帶來更多便利。

DolphinGemma:解碼海豚語言，探索跨物種溝通

DolphinGemma是谷歌與Wild Dolphin Project（WDP）和喬治亞理工學院合作開發的創新模型，旨在分析和生成海豚的複雜聲音。這款模型基於40年積累的北大西洋斑點海豚聲學數據，能夠識別簽名哨聲、脈衝爆裂聲等特定聲音模式，並預測聲音序列，類似於人類語言模型的預測機制。

DolphinGemma已集成到WDP的CHAT（Cetacean Hearing Augmentation Telemetry）系統中，通過智能手機界面實現實時海豚聲音分析。研究人員甚至嘗試通過合成哨聲與海豚進行簡單交互，例如請求海豚與特定物體互動。谷歌計劃於2025年夏季將DolphinGemma開源，允許更多研究者將其應用於其他鯨類物種，加速跨物種溝通的研究進程。

開源與未來:AI賦能跨領域創新

谷歌強調，這三款模型均基於Gemma架構，兼顧高效性和適應性。MedGemma現已通過Health AI Developer Foundations計劃開放使用，SignGemma和DolphinGemma也將在未來陸續開源。然而，Gemma系列的非標準許可條款也引發了一些開發者對商業應用的擔憂，未來谷歌可能需要進一步優化許可政策以提升模型的商業化潛力。

技術與社會價值的雙贏

從醫療診斷到手語翻譯，再到海豚語言研究，谷歌的三大Gemma模型變體展現了AI技術在解決實際問題和探索未知領域的無限可能。MedGemma爲醫療行業帶來了高效工具，SignGemma推動了無障礙溝通，而DolphinGemma則爲人類與自然界的對話打開了新窗口。AIbase認爲，這些創新不僅體現了技術的前瞻性，也彰顯了AI在社會價值與科學研究中的重要作用。

谷歌重磅發佈三大Gemma模型變體，AI醫療、手語翻譯與海豚語言解鎖新可能！

相關推薦

蘋果 Mac 迎來大爆發：16GB 內存竟能本地盲跑谷歌 Gemma 4 旗艦模型！

谷歌發佈首款離線 AI 聽寫應用 Eloquent：手機秒變專業速錄員

Starcloud 在太空中成功訓練大型語言模型

首個太空數據中心誕生！Starcloud 在軌道上訓練大語言模型

谷歌 Gemma 模型爭議揭示 AI 開發生命週期的風險