《芝加哥論壇報》日前向紐約聯邦法院正式起訴人工智能搜索引擎公司 Perplexity,指控其在未獲授權的情況下抓取新聞內容、繞過付費牆,並在其產品中直接提供原文級別的生成結果。

根據《論壇報》提交的訴狀,報社律師早在10月中旬就已詢問 Perplexity 是否使用了其內容。Perplexity 的律師迴應稱,公司並未將《論壇報》文章用作模型訓練數據,但“可能會出現一些非逐字的事實摘要”。然而,《論壇報》的律師反駁稱,Perplexity 實際提供的是高度貼近原文的內容,而非簡單摘要。

perplexity 1

訴訟還將矛頭指向 Perplexity 的檢索增強生成(RAG)系統。按理說,RAG 技術旨在通過引用經過驗證的數據源來減少模型偏差。但《論壇報》稱,Perplexity 在未獲授權的情況下,將其新聞內容納入 RAG 數據來源。此外,訴狀指出,Perplexity 的 Comet 瀏覽器涉嫌繞過付費牆,並向用戶提供報社文章的完整摘要。

值得關注的是,《論壇報》所屬的 MediaNews Group 和 Tribune Publishing 旗下共有17家新聞機構,這些機構今年4月已就訓練數據問題起訴 OpenAI 和微軟;其中9家媒體去年11月也發起了相似訴訟。此次行動顯示傳統媒體對 AI 公司使用其內容的擔憂持續加深。

目前,Perplexity 尚未迴應《論壇報》的指控,也未對 TechCrunch 的置評請求作出回覆。除本案外,Perplexity 近月還面臨來自 Reddit、道瓊斯公司等多起類似法律挑戰;亞馬遜也曾向其發出停止侵權通知函,警告其購物類 AI 瀏覽技術可能違法。

隨着更多媒體開始關注 AI 搜索引擎與內容抓取的邊界,本案或將推動法院進一步審視 RAG 技術在版權法律框架下的責任認定。