谷歌近日宣佈,將重新啓用其AI聊天機器人Gemini的人物圖像生成功能。這一決定來自於今年早些時候因歷史不準確報道而暫停的爭議性功能。根據谷歌的聲明,該功能的早期訪問版本將在未來幾天內向Gemini Advanced、Business和Enterprise用戶開放,目前僅支持英語。
此次升級由谷歌最新的AI文本轉圖像生成器Imagen3提供支持。Imagen3最初於本月初通過AI Test Kitchen悄然推出,現已在Gemini的所有語言版本中得到應用。升級後的工具能夠生成從照片級逼真的風景到紋理油畫等多樣化內容,只需"幾句話"描述即可完成創作。
谷歌Gemini產品管理高級總監Dave Citron表示,新版Imagen3模型配備了內置安全措施,"與其他可用的圖像生成模型相比,其性能更佳"。爲了避免之前出現的歷史不準確問題,谷歌對模型進行了優化,以確保生成的圖像更加準確和適當。
值得注意的是,Gemini的這一功能與谷歌新推出的Remagine功能有所不同。後者專門用於在使用Pixel9手機系列拍攝的照片中融入AI元素。
爲了進一步保障內容安全,Gemini不允許用戶創建公衆人物的逼真圖像、涉及未成年人的內容或血腥、暴力和性愛場景。Citron承認:"當然,Gemini創建的每幅圖像並非完美無缺,但我們將繼續聽取早期Gemini Advanced用戶的反饋,不斷改進。"
谷歌計劃在未來將AI生成人物圖像的能力擴展到更多用戶和語言版本,以滿足全球用戶的需求。這一舉措不僅展示了谷歌在AI圖像生成技術上的進步,也反映了公司在應對技術倫理和安全挑戰方面的決心。