近日,加利福尼亞州北區地方法院對一起引發廣泛關注的版權訴訟作出裁決,部分駁回了針對GitHub C o pilot編程工具及其前底層技術OpenAI Codex的訴訟請求。這一裁決可能爲使用受版權保護數據進行訓練的新型技術工具開創先例。
該訴訟由約瑟夫·薩維裏律師事務所於2022年提起,原告聲稱GitHub和OpenAI允許Co pil ot和Codex在未遵守版權聲明和署名等許可條款的情況下複製源代碼,從而侵犯了版權。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
法院駁回了原告根據《數字千年版權法》(DMCA)第1202(b)條提出的訴訟請求。該條款禁止刪除版權聲明。法院裁定,原告未能證明Copilot傾向於以完全相同的方式複製受版權保護的代碼。
原告引用了一項研究,稱隨着模型規模擴大,系統逐字複製訓練數據的可能性會增加。然而,法官Jon S. Tigar指出,該研究顯示C o p ilot"在良性情況下很少發出記憶的代碼,大多數記憶僅在模型被提示與訓練數據非常相似的長代碼摘錄時纔會發生。"
這一判決表明,只要新型技術系統在正常使用中不定期逐字複製其訓練材料,版權主張就可能面臨挑戰。該裁決還可能影響其他類似訴訟,如OpenAI與《紐約時報》的版權糾紛。
法院雖然駁回了不當得利和不正當競爭指控,但允許繼續進行違反開源許可協議的指控。原告辯稱,C o pilot未經署名就複製了代碼,違反了開源許可條款。
參與訴訟的程序員兼律師馬修·巴特里克強調了對潛在違反開源許可證的擔憂,他認爲像C o p ilot這樣的編程工具在未經許可的情況下將開源作品貨幣化。
這一裁決引發了業界對新興技術、版權保護和開源軟件未來發展的廣泛討論。
