近日,OpenAI 一起備受矚版權訴訟中達成了一項協議,決定向原告律師披露用於訓練生成性 AI 模型的數據。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
這場官司的原告是包括保羅・特倫佈雷、莎拉・爾弗曼、邁克爾・查邦、大衛・亨利・黃和塔 - 內西・茨等多位知名作家。他於去年對 OpenAI 及其附屬提起訴訟,指控其 AI 在未經授權的情況下使用了他們的作品,並在此基礎生成文本,違反了美國版權法和州不公平競爭法。
根據美國地方法羅伯特・爾曼的裁定,原告的將獲得進入 OpenAI 設立的安全的權限,在此可以查看訓練數據這一過程受到嚴格限制。安全室內禁止任何錄音設備,OpenAI 法律團隊也有權查看律師在房內所做的任何筆記。這些措施使得訓練數據的披露更像是對敏感源代碼的審查,而非簡單的信息共享。
盡 OpenAI 在法律上堅稱其使用版權作品的方式符合 “合理使用”,但此事引發了更多的關注因爲如果 OpenAI 訓練數據被廣泛披露,可能會引發更多的法律訴訟。而目前,針對 OpenAI 的版權指控不僅來自這幾位作家,還有其他的原告也在發起類似的訴訟。
值得一提的是,未來可能有更多的法規要求 AI 開發商更爲透明地披露其訓練數據。歐盟的《人工智能法》預計將在2025年生效,要求模型提供商公開訓練數據的詳細信息,以滿足那些對其權益有合法需求的羣體。此外,加利福尼亞州也通過了一項 AI 數據透明度法案,州長簽字。
儘管 OpenAI 堅持其生成的內容是基於對語言、推理和世界的理解,但法律上關於 AI 模型的行爲是否合適仍然存在爭議。隨着越來越多的訴訟和立法提案出現,AI 領域的未來仍然充滿不確定性。
劃重點:
📝 OpenAI 同意向律師披露訓練數據,滿足版權訟需要。
🔒 數據查看在嚴格控制的安全環境中進行,禁止攜帶錄音設備。
⚖️ 未來可能面臨更多法規,推動 AI 數據透明度的要求
