近日,美國紐約州 SUNY 健康科學大學的兩位教授 Susana Martinez-Conde 和 Stephen Macknik 對蘋果公司提起了一項集體訴訟。他們指控蘋果在訓練其 Apple Intelligence 人工智能模型時,未經許可使用了包含他們著作的盜版書庫 Books3。這一事件再次引發了關於人工智能訓練過程中的版權問題的廣泛關注。

根據訴狀,這兩位教授的書籍《Champions of Illusion: The Science Behind Mind-Boggling Images and Mystifying Brain Puzzles》和《Sleights of Mind: What the Neuroscience of Magic Reveals About Our Everyday Deceptions》被用於訓練 Apple Foundation Intelligence Models 和 OpenELM 語言模型。訴狀指出,蘋果在沒有獲得相關授權的情況下,不僅複製了他們的作品,還將這些作品用於測試模型性能以及作爲過濾器,防止版權內容出現在終端用戶面前。
Books3是一個曾經廣泛用於人工智能訓練的 “影子圖書館”,其收錄了多達186640本書籍文本,來源於 Bibliotik 私有 BitTorrent 追蹤器。蘋果公司在2024年4月發佈 OpenELM 時,曾承認使用了 “The Pile” 數據集,而該數據集中確實包含了 Books3的內容。目前,Books3因版權問題已於2023年10月下架。
此案引起關注的原因有二。一方面,作者應當獲得其作品被再利用與複製的法律補償;另一方面,人工智能訓練中對讀物版權的合法性問題仍存在廣泛爭議。以 Google 爲例,常常使用未獲授權的內容進行 AI 摘要展示,未必註明內容出處,這使得創作方難以獲得應有的權益。
美國法院在 Midjourney 相關案件中指出,AI 訓練階段的溯源和補償難以做到。不過,在近期的 Anthropic 案件中,法官則認爲,將訓練用的書籍集中存儲於中央數據庫,可能涉嫌直接侵犯版權。如果法院認定蘋果爲 “蓄意侵權”,每本書可能面臨最高15萬美元的賠償。
目前,兩位教授要求陪審團審判、經濟賠償,並禁止蘋果今後繼續使用他們的作品。蘋果方面目前尚未對訴訟的實質內容作出公開回應。儘管訴狀提到,Apple Intelligence 發佈當天蘋果市值上漲2000億美元,但實際上在過去五年內,蘋果的市值漲幅曾更高四次,表明此事件的市場影響仍需進一步觀察。
劃重點:
💼 學者對蘋果提起訴訟,指控其未經授權使用盜版書籍訓練 AI。
📚 Books3被稱爲 “影子圖書館”,收錄了大量未經授權的書籍文本。
⚖️ 如若被認定爲 “蓄意侵權”,蘋果將面臨高額賠償風險。
