近期,紐約時報(The New York Times)和《每日新聞》(Daily News)聯合起訴 OpenAI,指控其在未獲授權的情況下,使用他們的作品來訓練人工智能模型。
此案的發展引發了公衆的關注,因爲原告的律師團隊在最新的法庭文件中指出,OpenAI 的工程師在處理相關數據時,意外刪除了可能對案件有重要影響的證據。
據悉,OpenAI 在今年秋季曾同意提供兩臺虛擬機器,以便原告律師團隊能夠搜索其訓練數據中是否包含版權內容。虛擬機器是一種在計算機操作系統內運行的虛擬計算機,通常用於測試、數據備份和運行應用程序。自11月1日以來,紐約時報和《每日新聞》的法律顧問及其聘請的專家已在 OpenAI 的訓練數據上工作了超過150小時。
然而,在11月14日,OpenAI 的工程師意外地清除了其中一臺虛擬機器上存儲的搜索數據。根據原告律師的信件,儘管 OpenAI 嘗試恢復丟失的數據,並且在大多數情況下取得了成功,但由於文件夾結構和文件名稱 “不可恢復”,因此恢復的數據無法用於確定新聞原告的文章是如何被用來訓練 OpenAI 的模型的。
原告的法律顧問指出,他們並不認爲這次刪除是故意的,但這起事件表明,OpenAI“在搜索自己的數據集中,尋找潛在侵權內容方面處於最佳位置”。這意味着,OpenAI 應當利用其自身工具來更有效地查找相關的侵權內容。
OpenAI 在這起案件及其他類似案件中,始終堅稱,使用公開可用數據進行模型訓練是合理使用(fair use)。這意味着,OpenAI 認爲其無需爲使用這些例子支付版權費用,儘管其從這些模型中獲利。
值得一提的是,OpenAI 已經與越來越多的新媒體簽署了授權協議,包括美聯社、商業內幕、金融時報等,但對於這些協議的具體條款,OpenAI 並未公開。據悉,內容合作伙伴 Dotdash 每年獲得至少1600萬美元的報酬。
儘管在法律問題上存在爭議,OpenAI 並未確認或否認在未獲許可的情況下使用特定的版權作品進行 AI 訓練。
劃重點:
🌐 OpenAI 被指控在版權訴訟中誤刪了可能的重要證據。
🕒 原告律師表示,爲了恢復數據,他們耗費了大量時間和人力。
💼 OpenAI 堅持認爲其訓練模型使用公開數據屬於合理使用。