最近、会社は新世代のオープンソース医療大規模モデル「MedGemma 1.5」を正式に発表し、同時に臨床シーンに特化したオープンソース音声認識モデル「MedASR」も同時にリリースしました。これにより、医療分野における技術スタックがさらに充実されました。
「Gemma」シリーズの医療専用バージョンとして、MedGemma 1.5は前バージョンに比べて医学画像の理解と分析能力が大幅に向上しています。このモデルはテキストの診察記録や検査報告書、医学文献だけでなく、X線やCTなどの一般的な画像モダリティの記述データを組み合わせて処理でき、初期スクリーニングや診断推論を補助します。このアップグレードにより、MedGemmaは純粋なテキスト質問応答ツールから、マルチモーダルな臨床意思決定支援システムへと進化し、現実の医療ワークフローに近づいています。
一方で、MedASRのリリースは医師の文書作成負担という課題に直接対応しています。このモデルは医療音声シーンに最適化されており、医師と患者の会話や巡回記録、手術時の口述など専門的な内容を高精度で認識し、構造化されたテキストに自動変換することができ、電子カルテ入力効率を大幅に向上させます。グーグルは、これらのモデルが非識別化された臨床データに基づいて訓練されており、プライバシー保護規範を厳密に遵守していることを強調しています。また、これらはオープンソース形式で公開され、世界中の研究者や開発者が無料で使用できます。
今回の2つのモデルのリリースにより、グーグルは医療AI分野において「閉鎖的なサービス」から「オープンなエナジーアイ」への戦略の深化を示しています。Gemini医療アシスタントがHIPAA適合認証を取得した後、オープンソースモデルのリリースにより、医療機関、スタートアップ企業、学術チームのイノベーションの障壁がさらに低下し、AIが地域医療、遠隔診療、研究分析などの場面での普及を促進することになります。
AI医療が「利用可能」から「使いやすさ」への重要な段階に差し掛かっている今、グーグルはオープンソース+コンプライアンス+マルチモーダルのコンビネーションによって、安全性、実用性、拡張性を兼ね備えた医療AIエコシステムの基盤を構築しています。
