『シカゴ・トリビューン』はこのほど、ニューヨーク連邦裁判所に正式に人工知能検索エンジン企業であるPerplexityを提訴し、同社が許可なくニュースコンテンツを取得し、支払いゲートを回避し、製品内で原文レベルの生成結果を直接提供したと主張している。

『トリビューン』が提出した訴状によると、新聞社の弁護士は10月中旬にすでにPerplexityが自社のコンテンツを使用しているかどうかを尋ねた。Perplexityの弁護士は、会社が『トリビューン』の記事をモデル訓練データとして使用しておらず、「一部の非逐字的な事実要約が発生する可能性がある」と回答した。しかし、『トリビューン』の弁護士は、Perplexityが実際に提供しているのは簡単な要約ではなく、原文に非常に近い内容であると反論した。

perplexity 1

訴訟では、Perplexityの検索拡張生成(RAG)システムにも焦点が当てられている。通常、RAG技術は検証されたデータソースを参照することでモデルのバイアスを減らすことを目的としている。しかし、『トリビューン』は、Perplexityが許可なしに自社のニュースコンテンツをRAGデータソースに含めていると指摘した。また、訴状には、PerplexityのCometブラウザが支払いゲートを回避し、ユーザーに新聞社の記事の完全な要約を提供しているとも記されている。

注目すべきは、『トリビューン』が所属するMediaNews GroupおよびTribune Publishingの下には17のメディア機関があり、これらの機関は今年4月にOpenAIとマイクロソフトに対してトレーニングデータの問題で提訴しており、そのうち9つのメディアは昨年11月にも類似の訴訟を提起していた。今回の行動は、伝統的なメディアがAI企業が自社のコンテンツを使用することに対する懸念が深まっていることを示している。

現在、Perplexityは『トリビューン』の主張にまだ応えていないし、TechCrunchのコメント依頼にも返答していない。本件以外にも、Perplexityは最近、Redditやダウ・ジョーンズ社など複数の法律上の挑戦を受けている。また、アマゾンも同社に対して、ショッピング向けAIブラウザ技術が違法である可能性があるとして差止請求を送った。

より多くのメディアがAI検索エンジンとコンテンツ取得の境界に注目する中、本件は裁判所がRAG技術が著作権法枠組みにおいて責任をどのように判断するかをさらに検討するきっかけとなるかもしれない。