谷歌近日發佈了一款開創性的人工智能模型——DolphinGemma,旨在深入理解野生大西洋斑點海豚的交流模式。該項目由谷歌與野生海豚項目 (WDP) 和佐治亞理工學院的研究人員合作開發,利用WDP近40年來在巴哈馬羣島積累的龐大海豚音頻和視頻記錄數據庫。
DolphinGemma基於這些珍貴數據進行訓練,並採用谷歌先進的音頻技術SoundStream分詞器將海豚的聲音轉化爲數字格式。這款AI模型能夠識別、分析甚至生成逼真的海豚典型聲音模式序列,包括口哨聲、咔噠聲和脈衝串聲,其功能類似於人類語言模型,可以預測聲音序列中的下一個聲音。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
值得一提的是,研究人員正利用谷歌Pixel智能手機將DolphinGemma直接部署到水下,進行實地數據記錄和分析。與此同時,團隊還採用了CHAT系統(鯨類聽覺增強遙測系統),該系統將特製的人工哨聲與海藻或遊戲服等特定物體關聯起來,旨在讓海豚學習並使用這些聲音與研究人員互動。Pixel智能手機能夠實時識別海豚模仿的音調,並通過聲音反饋給潛水員,告知他們所請求的物體。
這項創新性的研究計劃結合了人工智能、移動技術和長期的實地觀察,目標是揭示海豚語言的結構,並最終實現某種形式的人類與海豚之間的交流。谷歌計劃於2025年夏季將DolphinGemma作爲開放模型發佈,供其他研究團隊用於分析海洋哺乳動物的交流。
DolphinGemma是谷歌將其人工智能技術應用於動物交流研究(特別是海洋哺乳動物)的更廣泛努力的一部分。作爲其“AI for Social Good”項目的一部分,谷歌還與美國國家海洋和大氣管理局 (NOAA) 合作開發了一款鯨魚探測人工智能,用於分析自2005年以來在太平洋12個地點記錄的海洋哺乳動物叫聲的水聽器數據。此外,谷歌的一個AI模型最近還幫助識別出一種此前未知的布氏鯨叫聲,這種被稱爲“Biotwang”的聲音是通過結合目擊和錄音確定的。
不僅如此,地球物種項目也在積極致力於創建動物交流的表徵,涵蓋單個物種以及跨物種的交流,其目標是理解包括蜜蜂舞蹈在內的各種非語言交流形式。
