谷歌近日爲其Gemini人工智能助手推出了兩項重要新功能:Canvas協作工作空間和Audio Overviews音頻概覽,進一步增強了其AI助手的實用性和用戶體驗。
Canvas:實時協作文檔創建
Canvas功能爲用戶提供了一個交互式工作區,使用戶能夠與AI協作創建文檔和代碼。該功能支持實時顯示更改,並通過集成的聊天界面讓用戶討論修改內容。
特別值得注意的是,Canvas能夠生成HTML和React代碼的即時預覽,完成的文檔可以直接導出到Google Docs。業內分析指出,這一功能與去年秋季ChatGPT推出的同名功能頗爲相似。
Audio Overviews:將文字轉化爲對話式音頻
Audio Overviews功能允許用戶將文檔、演示文稿和研究報告等書面內容轉換爲播客式對話,由兩位AI主持人進行分析討論。
谷歌通過將其更新的免費深度研究功能的輸出轉換爲AI音頻播客來展示這一技術。這些音頻摘要最初出現在NotebookLM平臺上。值得注意的是,與其他AI生成內容一樣,這些音頻內容可能包含不準確信息,用戶在使用時應保持適當的判斷力。
目前,Audio Overviews功能僅支持英語,可通過網絡和移動平臺訪問。用戶可以下載和分享創建的音頻文件。
Gemini生態系統持續擴展
自今年年初以來,谷歌一直在積極擴展其Gemini生態系統。最近的更新包括:
- Gemini Live增加了視頻和屏幕共享支持,率先在三星Galaxy S24/S25和Pixel9設備上推出
- 谷歌計劃用Gemini取代Google Assistant作爲Android的默認AI助手
- 推出了三種新的模型變體:Gemini2.0Flash(基礎模型)、Flash Lite(經濟高效版)和2.0Pro(具有擴展上下文處理能力)
- 在歐盟、瑞士和英國以外的地區,Gemini現可訪問用戶的Google搜索歷史記錄,提供更具情境化的響應
- 平臺獲得了用於生成和編輯圖像以及理解YouTube視頻的原生多模式功能
據谷歌官方消息,Canvas和Audio Overviews功能現已面向全球Gemini和Gemini Advanced用戶開放。