抄襲檢測公司Copyleaks最近發佈報告指出,OpenAI推出的GPT-3.5大語言模型生成內容中,高達60%含有不同形式的抄襲。Copyleaks使用自主開發的評分方法,考量文本相似度、微小改動、釋義等多方面因素將相似內容判定爲“抄襲”。計算機科學、物理學、心理學等學科的相似度最高,而戲劇、人文學科、英語的相似度較低。OpenAI表示已經採取各種措施限制無意記憶,使用條款也明確禁止用戶故意讓模型反編內容。此外,除了紐約時報提起的知名訴訟案,一些內容創作者也試圖主張AI模型就是在他們的作品上得到訓練的,所以產出近似副本內容也應該給予分成。