WIREDによると、ニューヨーク・タイムズやReddit、USA Todayの親会社を含む複数の主要メディアとプラットフォームは、最近インターネットアーカイブ(Internet Archive)の「タイムマシン(Wayback Machine)」ツールを正式にブロックしました。この措置は、AI企業がこのアーカイブツールを通じて著作権のあるコンテンツを間接的に取得し、モデルのトレーニングに使用するのを防ぐためです。

「利益を得ながらもブロックする」という皮肉な状況
皮肉なことに、USA Todayが最近発表した移民政策に関する統計データを扱った深掘り記事は、「タイムマシン」で保存された歴史的なデータによって初めて作成されました。しかし、同メディアグループのスポークスパーソンは、現在、すべてのクローラープログラム(IA-Archiverbotを含む)を全面的にブロックしており、増加するAIの著作権侵害のリスクに対応していると述べました。
メディア機関の多様な制限手段
現在、少なくとも23の主要なニュースサイトが制限措置を取っています:
完全ブロック: ニューヨーク・タイムズやRedditは、「タイムマシン」の専用クローラーを直接ブロックしています。
インターフェースフィルタリング: ザ・ガーディアンはクローラーを完全にはブロックしていませんが、インターネットアーカイブのAPIからそのコンテンツを除外し、検索インターフェースをフィルタリングすることで、ユーザーがその歴史的アーカイブを検索するのが非常に難しくしています。
出版業界によるブロック行動に対して、レチェル・マドーをはじめとする100人以上の現職ジャーナリストが、電子フロンティア財団(EFF)とともに支持声明を発表しました。彼らは、「タイムマシン」は事実確認、権力機関の行動の変化を追跡し、デジタル歴史を保存するための「不可欠なツール」であると考えています。
