2025 年 4 月 30 日 - AIbase報道:谷歌旗下AI研究助手NotebookLM迎來重大更新,其音頻概述(Audio Overviews)功能現已支持超過 50 種語言,其中包括備受期待的中文音頻支持。這一突破性進展得益於谷歌Gemini模型的原生音頻處理能力,爲全球用戶提供了更便捷的多語言學習與內容創作體驗。
多語言支持打破語言壁壘
NotebookLM的音頻概述功能自 2024 年 9 月推出以來,以其將上傳文檔轉化爲類似播客的生動討論而廣受好評。最初,該功能僅支持英語,限制了其在非英語地區的應用。此次更新將支持範圍擴展至 50 多種語言,包括中文(簡體與繁體)、法語、西班牙語、葡萄牙語、印地語、土耳其語等,覆蓋全球主要語種。
通過新增的"輸出語言"設置,用戶可隨時切換音頻概述的生成語言。這一功能尤其適合跨語言學習與研究場景。例如,一位教師可以上傳關於亞馬遜雨林的多語言資料,如葡萄牙語紀錄片、西班牙語研究論文及英語報告,學生則可生成任意語言的音頻概述,從而打破語言障礙,獲取關鍵信息。這種靈活性爲教育、科研及內容創作領域開闢了新的可能性。
中文音頻表現超出預期
此次更新的亮點之一是中文音頻支持的出色表現。用戶反饋顯示,NotebookLM生成的中文音頻概述在語音自然度、語調流暢性及內容準確性上均表現優異,接近真人播客水平。這一功能的推出受到中文用戶的高度關注,許多用戶表示,中文音頻的清晰表達和高質量總結大幅提升了信息獲取效率。
例如,一位用戶在社交媒體上分享:"NotebookLM的中文音頻功能讓人驚喜,從學術資料到日常筆記,都能快速生成流暢的播客式總結,效果遠超預期。"類似反饋表明,中文音頻支持不僅滿足了用戶需求,還進一步鞏固了NotebookLM在AI輔助工具領域的領先地位。
技術驅動與未來展望
此次多語言支持的實現得益於谷歌Gemini模型的強大音頻處理能力。Gemini通過分析上傳的多種格式來源(如PDF、Google Docs、網頁鏈接等),生成結構化且引人入勝的音頻內容。用戶可上傳多達 50 個來源,每個來源支持高達 50 萬字,足以應對複雜的研究項目或大型內容創作需求。
谷歌表示,這僅是多語言音頻功能的"早期展示",未來將根據用戶反饋持續優化,包括提升非英語語言的生成質量、擴展支持語種,以及進一步完善語音語調的自然度。此外,NotebookLM的免費版本已向全球 200 多個國家和地區開放,用戶只需登錄Google賬戶即可體驗這一功能。
應用場景廣泛,助力全球用戶
NotebookLM的多語言音頻概述功能爲多種場景提供了創新解決方案。在教育領域,教師可利用該功能生成多語言學習材料,幫助學生更高效地掌握知識;在商業領域,企業可將多語言客戶資料轉化爲音頻總結,提升跨國溝通效率;在個人學習中,用戶可將外語文獻轉化爲母語音頻,加速知識吸收。
值得注意的是,儘管非英語語言支持仍處於Beta階段,谷歌建議用戶在使用時檢查生成音頻的準確性,以確保內容質量。即便如此,NotebookLM的多語言擴展已展現出強大的潛力,有望成爲全球用戶不可或缺的AI助手。
AIbase觀點
作爲一款以用戶上傳內容爲核心的AI工具,NotebookLM通過多語言音頻概述的推出,進一步彰顯了其在信息處理與知識合成的獨特優勢。AIbase認爲,這一功能的廣泛應用將推動AI技術在教育、科研和跨文化交流領域的普及,尤其對中文用戶而言,高質量的中文音頻支持無疑是一大福音。欲體驗NotebookLM的多語言音頻功能,用戶可訪問notebooklm.google.com,通過簡單的設置即可生成個性化音頻概述。AIbase將持續關注NotebookLM的後續更新,爲讀者帶來最新的AI技術動態。