Cloudflare 於週三爲網站託管客戶提供了一種阻止 AI 機器人抓取網站內容並未經允許使用數據訓練機器學習模型的方法。

它是基於客戶對 AI 機器人的厭惡,並表示爲了幫助保護內容創作者在互聯網上的安全,該公司在一份聲明中稱。

搜索 網頁

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

“我們清楚地聽到客戶不希望 AI 機器人訪問他們的網站,尤其是那些不誠實地這樣做的。爲了幫助,我們添加了一個全新的一鍵封堵所有 AI 機器人的功能。”

對網站所有者來說,已經有一種相對有效的方法可以阻止機器人,那就是廣泛可用的 robots.txt 文件。當放置在網站的根目錄時,自動網絡爬蟲應該會注意到並遵守文件中告訴它們不要進入的指令。

鑑於普遍認爲生成式 AI 是基於盜竊行爲,並有許多法律訴訟試圖追究 AI 公司的責任,從事 “洗淨” 內容的公司慷慨地讓網絡發佈者選擇不參與竊取。

去年八月,OpenAI 發佈了有關如何使用 robots.txt 指令阻止其 GPTbot 網絡爬蟲的指導,可能是因爲意識到人們擔心內容被擅自抓取並用於 AI 訓練而沒有同意。谷歌在隨後的一個月也採取了類似的措施。同樣在去年九月,Cloudflare 開始提供一種阻止遵守規則的 AI 機器人的方法,據稱85% 的客戶啓用了此阻止功能。 

劃重點:

⭐️ Cloudflare 推出一鍵封堵 AI 網絡爬蟲功能,確保網站內容不被未經允許的 AI 機器人使用。

⭐️ 生成式 AI 被視爲盜竊源頭,各大公司紛紛採取措施阻止 AI 機器人未經授權地擅用內容。

⭐️ Cloudflare 利用機器學習模型識別和阻止僞裝的網絡爬蟲,保障內容創作者在互聯網上的權益。