在《紐約時報》起訴 OpenAI 的長期版權侵權訴訟中,案件取得了重大進展。據 Ars Technica 報道,審理此案的聯邦法官已授權《紐約時報》及其共同原告《紐約每日新聞》和調查報道中心,訪問 OpenAI 的用戶日誌,包括已刪除的內容,以精確查明侵權範圍。
《紐約時報》認爲,ChatGPT 用戶可能會在繞過付費牆後刪除歷史記錄,因此有必要進行大規模的數據覆蓋。該報進一步聲稱,這些日誌的搜索結果可能成爲整個訴訟的關鍵證據:OpenAI 的大型語言模型(LLM)不僅使用了其受版權保護的材料進行訓練,還可能直接抄襲這些內容。這項命令已於上個月發佈,並在 OpenAI 試圖上訴後於本週獲得確認。
OpenAI 對此深表不滿。上個月,該公司聲稱這項命令將迫使其繞過“長期以來的隱私規範”。在最新裁決公佈後,OpenAI 的一位發言人告訴 Ars,他們打算“繼續抗爭”。
值得注意的是,這一裁決是在《紐約時報》等出版商與 OpenAI 協商如何處理數據庫搜索之際做出的。正如 OpenAI 上個月在一份聲明中指出的那樣,該命令涵蓋了從免費的 ChatGPT 日誌到使用其 API 的用戶的更敏感信息。(該命令特別指出,ChatGPT Enterprise 和 ChatGPT Edu,即其專爲高校定製的模型,的日誌將不受限制。)
除了尋找版權侵權的證據,OpenAI 的日誌策略也可能有助於證明 ChatGPT 通過在聊天機器人內總結文章來稀釋新聞市場,這最終導致媒體機構廣告收入的損失,因爲它們的鏈接被潛在讀者完全繞過。據 《福布斯》 報道,今年早些時候,內容授權平臺 TollBit 發現,OpenAI、谷歌和其他公司的聊天機器人向出版商發送的流量比傳統搜索引擎少 96%——這一趨勢已開始對新聞行業造成損害。
在文字提供者和人工智能之間的這場“生存鬥爭”中,市場稀釋的證據可能會使天平偏向版權持有者,正如上個月一位法官告訴起訴 Anthropic 的出版商那樣——這對於任何試圖繞過付費牆的用戶來說,都將產生重大影響。