3月18日、アップル社は「The Pile」というデータセットを使用して人工知能のトレーニングを行ったとして、心の糧出版(Chicken Soup for the Soul, LLC)から著作権侵害訴訟の被告に再度指定されました。今回の訴訟は規模が大きく、アップルに加えメタ、xAI、グーグル、Anthropic、OpenAI、PerplexityおよびNVIDIAなどの世界的なテック大手も訴訟リストに含まれています。この事件の核心的な論点は、「Books3」と呼ばれる影の図書館モジュールであり、これは多くの著作権保護された文学作品を含んでいます。

アップル、Apple、発表会、iPhone

この指摘に対し、アップル社は2024年から合法的で倫理的な方法でAIデータセットを構築することに取り組んできたと強調しました。アップルの研究者たちは「The Pile」データセットをOpenELMsオープンソースプロジェクトで使用したことはありますが、公式にはこのプロジェクトは公開研究のためにのみ使用され、主要なApple Intelligenceシステムには使用されていないと説明しています。しかし、法律専門家は、アップルのベーシスモデルがグーグルのGeminiによって補助的にトレーニングされたため、もしグーグルがこの事件で違反と判断された場合、アップルは技術供給チェーンの関連性により複雑な連帯責任を負う可能性があると分析しています。

現在、Perplexityなどの企業はネットワーククローリング行為を擁護しており、アップルはそのモデルトレーニングの透明性と合規性を堅持しています。AIの規制環境が厳しくなる中、この下位層のトレーニングデータをめぐる集団訴訟は、作曲家グループがテック大手の「データ収奪」に対する反撃を強化したことを示すだけでなく、業界がモデルトレーニングにおける「データソースの追跡」の合規コストと技術境界を見直すきっかけとなるでしょう。