最近,Meta 公司在人工智能訓練方面的做法受到廣泛關注。根據一項訴訟,這家公司被指控在未獲得授權的情況下,下載了大量盜版電子書和文章,用於訓練其人工智能模型。此次事件的核心是幾封泄露的電子郵件,這些郵件爲 Meta 的行爲提供了進一步的證據。

郵件中顯示,Meta 承認下載了一個名爲 LibGen 的爭議性大型數據集,該數據集中包含了數千萬本盜版書籍。根據原告提交的法庭文件,Meta 通過名爲 Anna's Archive 的網站,從多個影子圖書館下載了至少81.7TB 的數據,其中包括來自 Z-Library 和 LibGen 的至少35.7TB 數據。此外,Meta 之前還從 LibGen 下載了80.6TB 的數據。這些數字顯示,Meta 公司在這一非法行爲上的規模是驚人的。原告指出,儘管其他小規模的盜版行爲已導致法律追究,但 Meta 的行爲卻更加嚴重。
在郵件的內容中,Meta 的員工也表達了對其行爲的法律風險的擔憂。2023年4月,該公司研究工程師尼古拉・巴什利科夫曾表示:“用公司的筆記本電腦下 BT 感覺不妥。” 到了2023年9月,巴什利科夫對此的反對聲音更加明顯,並諮詢了法律團隊。他指出,“使用 Torrents 意味着對文件進行‘播種’,即對外共享內容。這在法律上是不允許的。” 然而,儘管有這樣的警告,Meta 似乎仍決定隱瞞其下載和共享活動,並通過編輯設置儘量減少 “播種” 行爲的可追溯性。
據稱,Meta 還試圖通過將數據集下載到非 Meta 服務器上,來降低被追溯到其服務器的風險。這一系列的行爲引發了外界對 Meta 公司在數據使用和版權方面的深刻反思。
劃重點:
📚 Meta 公司被指控非法下載81.7TB 盜版書籍,涉嫌用於 AI 訓練。
⚖️ 員工對法律風險表示擔憂,曾警告下載行爲可能觸犯法律。
🔍 Meta 試圖通過隱瞞和使用非公司服務器來規避法律責任。
