先日、Googleはイルカのコミュニケーション方法を科学者がより深く理解できるよう支援することを目的とした、DolphinGemmaという大型言語モデルを発表しました。この新技術はGemini2.5Pro Experimentalによって駆動され、ジョージア工科大学とその野生イルカプロジェクト(WDP)と緊密に連携しています。WDPの目標は、長期間にわたる非侵襲的な観察を通して、大西洋バンドウイルカ(Stenella frontalis)の自然行動と社会構造、特にコミュニケーションパターンを記録・分析することです。

長年にわたり、WDPは大量のデータを蓄積し、特定のイルカの音声をその行動と関連付けることができました。例えば、母親イルカと子供イルカが一緒の時の独特のホイッスル、争っている時の悲鳴、サメを追いかけている時の「ブンブン」という音などです。Googleは、イルカの複雑なコミュニケーション方法の分析は困難な課題であり、WDPのデータはAIの応用に絶好の機会を提供すると述べています。

Google (3)

DolphinGemmaはこのデータに基づいて開発されました。このモデルはGoogleのSoundStreamトークナイザーを採用し、イルカの音声を管理可能なオーディオ単位に分解します。システム全体のアーキテクチャは、複雑な音声シーケンスを理解するように設計されており、約4億個のパラメータを含み、WDPの研究者のPixelスマートフォンでネイティブに動作します。

従来の機械学習モデルとは異なり、DolphinGemmaはオーディオ入出力に特化しており、イルカの自然な音を聞き取り、大型言語モデルが人間の言葉を理解する方法と同様に、次に最も可能性の高い音を予測します。このプロセスは、イルカのコミュニケーションを「オートコンプリート」する機能に例えることができます。DolphinGemmaはイルカの音声のパターンと構造を認識し、科学者により多くの研究の可能性を提供します。

さらに、DolphinGemmaの発表前に、クジラ聴覚増強遠隔測定技術(CHAT)チームもイルカの双方向コミュニケーションの可能性を探っていました。CHATの目標はイルカの言葉を完全に解読することではなく、シンプルで使いやすいインタラクティブな語彙を作成することです。合成音声をイルカが好む特定の物体(ホンダワラ、海草など)に関連付けることで、研究チームはイルカがこれらの音を模倣し、これらの物を積極的に「要求」することを期待しています。

Googleは、DolphinGemmaを今年の夏にオープンモデルとして公開し、世界中の研究者にツールを提供して、独自の音響データセットを掘り下げ、これらの知的な海洋哺乳類をより深く理解することを目指すと述べています。