OpenAI 發佈了網絡爬蟲 GPTBot 的規範,並表示收集的內容將用於改進未來的模型。網站發佈者可以拒絕提供素材,而一旦數據被爬取,就很難從公共數據集中刪除。一些網站已經採取措施阻止 OpenAI 的爬蟲,但此舉引發了更多關於數據隱私和合規性的討論。OpenAI 的競爭對手谷歌提議重新設計爬蟲協議的運作方式,以減少數據歸屬權糾紛。總體而言,這篇文章討論了 OpenAI 的爬蟲規範以及相關的法律和隱私問題。