生成式人工智能因其可靠性不足、巨大能耗以及未經授權使用版權材料而備受爭議。然而,最近一起針對人工智能公司 Anthropic 的法庭案件揭示了一個更令人震驚的真相:爲了訓練其 AI 助手,該公司竟然銷燬了數百萬本實體書籍。
在這起案件中,法官發現 Anthropic 爲構建其語言模型 Claude,進行了大規模的書籍銷燬行爲。這家科技公司購買了大量實體書籍,隨後通過撕下裝訂線和掃描書頁的方式將其數字化,這一過程不僅徹底毀壞了這些書籍,還沒有打算將最終的數字版本公開。這樣的做法在法院判決 Anthropic 勝訴的過程中起到了重要作用。法官認爲,這種數字化處理構成了充分的轉化,符合合理使用的規定。
然而,儘管 Claude 能夠利用這些數字化書籍生成獨特內容,批評人士指出,大型語言模型仍有可能在其訓練過程中逐字複製內容。Anthropic 的部分法律勝利使其能夠在不通知原出版商或作者的情況下,利用受版權保護的書籍進行 AI 模型訓練,這可能會消除生成 AI 行業面臨的一大障礙。
值得注意的是,Metal 的一位前高管曾表示,如果 AI 必須遵守版權法,整個行業可能會在一夜之間崩潰,因爲開發人員將難以獲得訓練大型語言模型所需的龐大數據。而持續的版權糾紛也給這一技術的發展帶來了巨大威脅。近期,Getty Images 的首席執行官也承認,公司無法承擔所有與 AI 相關的版權侵權費用。與此同時,迪士尼對圖像生成公司 Midjourney 的訴訟,展示了圖像生成器複製受版權保護內容的能力,這可能會對整個生成 AI 生態系統產生深遠影響。
儘管法官判決 Anthropic 在部分問題上敗訴,指出該公司依賴盜版圖書庫訓練 Claude,但該公司仍需在12月進行版權審判,屆時可能面臨每部盜版作品高達15萬美元的賠償金。這場版權爭鬥無疑將爲生成式人工智能的未來蒙上陰影。