ソフトウェア大手のアドビは、近日、著作権が保護された違法な書籍を人工知能モデルの訓練に不法に使用したとして、集団訴訟の提案に直面しています。

オレゴン州の著者エリザベス・ライオン(Elizabeth Lyon)は、影響を受けたグループを代表して訴訟を提起し、アドビが彼女の作品を含む違法な書籍データセットを使用して、名前が「SlimLM」である軽量言語モデルを開発したと主張しています。

訴訟では、SlimLMがオープンソースデータセット「SlimPajama-627B」で事前トレーニングされていることが指摘されています。このデータセットは、約19万1,000冊の無許可の電子書籍を含むことで知られている「Books3」サブセットを含んでいるとされています。

アドビだけが被害を受けているわけではありません。AppleやSalesforce、Anthropicなどの企業も、RedPajamaやBooks3の内容を含む類似のデータセットを使用したことで法律的なトラブルに巻き込まれています。モデルの用途:訴えられているSlimLMモデルは、主にモバイルデバイス上の文書補助タスクの最適化に使用されています。

現在、アドビはこの訴訟に対して正式なコメントを出していません。AI技術の広範な応用が進む中、トレーニングデータの合規性に関するこのような法律的な対立は、業界の転換点となる重要な要素となっています。