谷歌雲在位於倫敦的 DeepMind 總部舉行了一場會,正式推出其高清語模型 Chirp3。該模型通過 Vertex AI 統一機器學習平臺向開發者開放,提供了豐富的開發工具,助力程序的創新。

QQ_1742262673191.png

Chirp3支持248種不同的聲音,並可用31種語言進行語音合成。開發者可以利用這一模型創建多種應用,如智能語音助手、有聲讀物和視頻配音等。谷歌表示,Chirp3的語音功能能夠捕捉人類語調的細微差別,使得對話更加生動和引人入勝。

除了使用現成的語音,用戶還可以通過谷歌雲的文本轉語音 API 創建自定義語音。然而,谷歌爲了確保負責任的使用,限制了這一語音克隆功能的訪問權限,以防止潛在的濫用行爲,並確保符合倫理 AI 的實踐。

在發佈會上,谷歌雲首席執行官托馬斯・庫裏安(Thomas Kurian)強調,谷歌的總體願景是提供一系列廣泛的模型,除了 Chirp3外,還包括 Gemini、Imagen、Veil 等多款產品。谷歌還推出了一個名爲 Agent Space 的新產品,專爲商業用戶設計,以滿足其特定需求。

谷歌 DeepMind 的首席執行官德米斯・哈薩比斯(Sir Demis Hassabis)也介紹了 Gemini 的演進,尤其是其多模態理解能力。他提到,在 AI Studio 中,用戶可以發佈 YouTube 鏈接,Gemini 能夠處理視頻內容,利用其長時上下文窗口讓用戶提問,快速找到講座或體育賽事的關鍵時刻。

此外,谷歌還藉此機會宣佈了一項計劃,旨在通過綜合培訓項目來提升英國的 AI 技能,幫助專業人士有效掌握 AI 技術。谷歌將向英國初創企業提供雲基礎設施和 AI 工具的使用積分,支持它們快速開發和擴展創新解決方案,以刺激創業活動。

在隱私和合規性方面,谷歌重申了對數據駐留的承諾,其 Vertex AI 和 Agent Space AI 工具可以幫助組織在符合當地法律的情況下,進行模型的訓練和服務。這一點對於醫療和金融等行業至關重要,因爲這些領域對隱私和合規性要求極高

項目:https://cloud.google.com/text-to-speech/docs/chirp3-hd

劃重點:

🌟 谷歌雲推出 Chirp3語音模型,支持248種聲音和31種語言,助力開發者構建智能應用。  

🔒 谷歌限制語音克隆功能的訪問權限,以確保倫理 AI 的實踐和防止濫用。  

💼 谷歌發起計劃提升英國 AI 技能,並向初創企業提供雲基礎設施支持,促進創新。