『WIRED』誌の報道によると、アマゾンウェブサービス(AWS)は、AI検索スタートアップ企業Perplexity AIに対し、AWSのサービス規約に違反し、アクセスを拒否されているウェブサイトのコンテンツをスクレイピングした疑いで調査を行っているとのことです。

ジェフ・ベゾスの家族基金とNvidiaの支援を受けているPerplexity AIは、最近30億ドルの評価額に達した新興企業です。『WIRED』誌は、同社がrobots.txtによってアクセスが禁止されているウェブサイトのコンテンツをスクレイピングしている可能性があると指摘しています。robots.txtは、どのページに自動化されたボットやクローラーがアクセスすべきでないかを指示するウェブ標準であり、法的拘束力はありませんが、多くの企業が従来から遵守してきました。

AWS、アマゾン、クラウドサービス、Amazon、クラウドコンピューティング、サーバー

AWSの広報担当者は、同社のサービス規約では、顧客がサービスを違法行為に使用することを禁じており、顧客は規約とすべての適用法を遵守する責任があると述べています。AWSの顧客は、ウェブサイトをクロールする際にはrobots.txt標準を遵守する必要があります。

調査によると、Perplexityは非公開のIPアドレスを使用してサーバーにアクセスしており、このサーバーは過去3ヶ月間にコンデナスト傘下の資産に数百回アクセスしており、明らかにアクセス禁止されているコンテンツをスクレイピングしようとしていたことが明らかになりました。『ガーディアン』『フォーブス』『ニューヨーク・タイムズ』の広報担当者も同様の状況を確認しています。

PerplexityのCEOであるAravind Srinivas氏は、発見されたスクレイピング行為は、ウェブスクレイピングとインデックス作成サービスを提供するサードパーティ企業によって行われたものだと述べていますが、その企業名を明らかにすることを拒否しています。Perplexityの広報担当者Sara Platnick氏は、アマゾンの問い合わせに応答し、PerplexityBotはrobots.txtを尊重するものの、ユーザーが特定のURLを入力した場合はそのプロトコルを無視すると述べています。

デジタルコンテンツ業界の業界団体であるDigital Content NextのCEOであるJason Kint氏は、Perplexityに対する告発が事実であれば、同社は潜在的な著作権侵害を防ぐための多くの原則に違反していると述べています。彼は、AI企業は、許可なく出版社のコンテンツを取得および使用すべきではないと強調しています。

現在、この事件は、AI企業によるデータ取得方法に対する幅広い注目と議論を引き起こしています。業界では、AWSの調査結果の発表と、Perplexityに対するさらなる措置を期待しています。