《芝加哥论坛报》日前向纽约联邦法院正式起诉人工智能搜索引擎公司 Perplexity,指控其在未获授权的情况下抓取新闻内容、绕过付费墙,并在其产品中直接提供原文级别的生成结果。

根据《论坛报》提交的诉状,报社律师早在10月中旬就已询问 Perplexity 是否使用了其内容。Perplexity 的律师回应称,公司并未将《论坛报》文章用作模型训练数据,但“可能会出现一些非逐字的事实摘要”。然而,《论坛报》的律师反驳称,Perplexity 实际提供的是高度贴近原文的内容,而非简单摘要。

perplexity 1

诉讼还将矛头指向 Perplexity 的检索增强生成(RAG)系统。按理说,RAG 技术旨在通过引用经过验证的数据源来减少模型偏差。但《论坛报》称,Perplexity 在未获授权的情况下,将其新闻内容纳入 RAG 数据来源。此外,诉状指出,Perplexity 的 Comet 浏览器涉嫌绕过付费墙,并向用户提供报社文章的完整摘要。

值得关注的是,《论坛报》所属的 MediaNews Group 和 Tribune Publishing 旗下共有17家新闻机构,这些机构今年4月已就训练数据问题起诉 OpenAI 和微软;其中9家媒体去年11月也发起了相似诉讼。此次行动显示传统媒体对 AI 公司使用其内容的担忧持续加深。

目前,Perplexity 尚未回应《论坛报》的指控,也未对 TechCrunch 的置评请求作出回复。除本案外,Perplexity 近月还面临来自 Reddit、道琼斯公司等多起类似法律挑战;亚马逊也曾向其发出停止侵权通知函,警告其购物类 AI 浏览技术可能违法。

随着更多媒体开始关注 AI 搜索引擎与内容抓取的边界,本案或将推动法院进一步审视 RAG 技术在版权法律框架下的责任认定。