谷歌發佈 DolphinGemma:AI破譯海豚語言：Pixel手機變身“翻譯器”

谷歌近日發佈了一款開創性的人工智能模型——DolphinGemma，旨在深入理解野生大西洋斑點海豚的交流模式。該項目由谷歌與野生海豚項目（WDP）和佐治亞理工學院的研究人員合作開發，利用WDP近40年來在巴哈馬羣島積累的龐大海豚音頻和視頻記錄數據庫。

DolphinGemma基於這些珍貴數據進行訓練，並採用谷歌先進的音頻技術SoundStream分詞器將海豚的聲音轉化爲數字格式。這款AI模型能夠識別、分析甚至生成逼真的海豚典型聲音模式序列，包括口哨聲、咔噠聲和脈衝串聲，其功能類似於人類語言模型，可以預測聲音序列中的下一個聲音。

圖源備註:圖片由AI生成，圖片授權服務商Midjourney

值得一提的是，研究人員正利用谷歌Pixel智能手機將DolphinGemma直接部署到水下，進行實地數據記錄和分析。與此同時，團隊還採用了CHAT系統（鯨類聽覺增強遙測系統），該系統將特製的人工哨聲與海藻或遊戲服等特定物體關聯起來，旨在讓海豚學習並使用這些聲音與研究人員互動。Pixel智能手機能夠實時識別海豚模仿的音調，並通過聲音反饋給潛水員，告知他們所請求的物體。

這項創新性的研究計劃結合了人工智能、移動技術和長期的實地觀察，目標是揭示海豚語言的結構，並最終實現某種形式的人類與海豚之間的交流。谷歌計劃於2025年夏季將DolphinGemma作爲開放模型發佈，供其他研究團隊用於分析海洋哺乳動物的交流。

DolphinGemma是谷歌將其人工智能技術應用於動物交流研究（特別是海洋哺乳動物）的更廣泛努力的一部分。作爲其“AI for Social Good”項目的一部分，谷歌還與美國國家海洋和大氣管理局 (NOAA) 合作開發了一款鯨魚探測人工智能，用於分析自2005年以來在太平洋12個地點記錄的海洋哺乳動物叫聲的水聽器數據。此外，谷歌的一個AI模型最近還幫助識別出一種此前未知的布氏鯨叫聲，這種被稱爲“Biotwang”的聲音是通過結合目擊和錄音確定的。

不僅如此，地球物種項目也在積極致力於創建動物交流的表徵，涵蓋單個物種以及跨物種的交流，其目標是理解包括蜜蜂舞蹈在內的各種非語言交流形式。

谷歌發佈 DolphinGemma:AI破譯海豚語言：Pixel手機變身“翻譯器”

相關推薦

谷歌發佈 FACTS 基準:AI 模型準確性面臨70% 天花板挑戰

美國監獄電話隱私大曝光：囚犯通話竟成 AI 訓練材料

Google 全球擴展 Gemini 3 AI 模式，覆蓋全球 120 個國家

OpenAI 宣佈將停止 GPT-4o 模型 API 訪問，開發者需儘快遷移

Poe AI 羣聊功能重磅上線： 200 人協作，AI 模型混搭，革新多人互動體驗！

谷歌發佈 DolphinGemma:AI破譯海豚語言：Pixel手機變身“翻譯器”

相關推薦

谷歌發佈 FACTS 基準:AI 模型準確性面臨70% 天花板挑戰

​美國監獄電話隱私大曝光：囚犯通話竟成 AI 訓練材料

Google 全球擴展 Gemini 3 AI 模式，覆蓋全球 120 個國家

​OpenAI 宣佈將停止 GPT-4o 模型 API 訪問，開發者需儘快遷移

Poe AI 羣聊功能重磅上線： 200 人協作，AI 模型混搭，革新多人互動體驗！

美國監獄電話隱私大曝光：囚犯通話竟成 AI 訓練材料

OpenAI 宣佈將停止 GPT-4o 模型 API 訪問，開發者需儘快遷移