最近,谷歌宣佈將其文本水印工具 SynthID 開源,旨在幫助開發者更好地識別 AI 生成的文本。這一工具現已通過谷歌的 “負責任生成 AI 工具包” 向公衆開放使用。

谷歌 DeepMind 的研究副總裁 Pushmeet Kohli 表示,這項技術將使其他生成式 AI 開發者能夠檢測文本輸出是否來自他們自己的大型語言模型(LLM),這將有助於他們以更負責任的方式構建 AI 應用。

在當今這個信息傳播迅速的時代,水印技術顯得尤爲重要。隨着大型語言模型被用來傳播政治虛假信息、生成不當內容等,水印工具的需求也在不斷上升。比如,加利福尼亞州正考慮將 AI 水印作爲強制性要求,而中國早在去年就已開始要求使用水印。儘管如此,相關技術仍在不斷完善之中。

谷歌的 SynthID 技術首次在去年8月被公佈。它通過在生成的文本、圖像、音頻和視頻中添加不可見的水印,使得 AI 生成的輸出更易於識別。

具體來說,SynthID 會在文本輸出中微調每個生成詞的概率,使得這些修改在軟件中可被識別但不被人類察覺。例如,當模型生成 “我最喜歡的熱帶水果是__。” 時,可能會選擇 “芒果”、“荔枝”、“木瓜” 或 “榴蓮” 等詞。每個詞都有一個概率分數,SynthID 會在不影響文本質量、準確性和創造性的前提下,調整這些分數。

這種調整會在整個生成的文本中持續進行,所以一段文本可能會有十個以上的調整分數,而整頁內容可能會包含數百個。最終,這些調整後的概率分數模式將構成水印。谷歌表示,該系統已集成到其 Gemini 聊天機器人中,且不會影響生成文本的質量和速度。然而,它在短文本、已重寫或翻譯的內容以及針對事實問題的迴應上仍面臨一些挑戰。

谷歌在一篇博客中指出:“SynthID 並不是識別 AI 生成內容的萬能鑰匙,但它是開發更可靠 AI 識別工具的重要基石,可以幫助數百萬用戶做出更明智的決策。”

項目入口:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn

劃重點:

📜 SynthID 開源,幫助開發者識別 AI 生成的文本。  

🛠️ 水印技術在應對虛假信息和不當內容中變得愈發重要。  

💡 谷歌的 SynthID 能夠微調文本生成的概率分數,形成水印。