最近、アメリカ・ニューヨーク州のSUNY健康科学大学の教授であるSusana Martinez-Conde氏とStephen Macknik氏は、アップル社に対して集団訴訟を提起しました。彼らはアップルがApple Intelligence人工知能モデルの訓練に、著作権侵害の本のデータベース「Books3」を使用したとして、許可なしに使用したことを指摘しています。この出来事は、人工知能のトレーニングにおける著作権問題について再び注目を集めています。

著作権、違法複製

訴状によると、これらの教授の著書『Champions of Illusion: The Science Behind Mind-Boggling Images and Mystifying Brain Puzzles』および『Sleights of Mind: What the Neuroscience of Magic Reveals About Our Everyday Deceptions』は、Apple Foundation Intelligence ModelsとOpenELM言語モデルのトレーニングに使われました。訴状では、アップルが関連するライセンスを得ることなく、作品を複製し、モデルの性能テストや、ユーザーに表示される著作権コンテンツをフィルタリングするためにも使用したと指摘されています。

Books3は、以前から人工知能のトレーニングに広く利用されていた「影の図書館」で、BibliotikというプライベートなBitTorrentトラッカーから収集された186,640冊の本のテキストが含まれていました。アップルは2024年4月にOpenELMをリリースした際に、「The Pile」というデータセットを使用したことを認めたものの、その中にはBooks3の内容が含まれていたことが判明しています。現在、Books3は著作権の問題により2023年10月にダウンロード不可となっています。

この事件が注目されている理由は二つあります。第一に、著作権者は自分の作品が再利用または複製される際の法的補償を受けられるべきです。第二に、人工知能のトレーニングにおける読書の著作権の合法性についてはまだ大きな議論があります。グーグルなどの例を見ても、AIによる要約表示で許可されていないコンテンツを頻繁に使用し、内容の出典を必ずしも明記しないため、創作側が適切な権利を得るのが難しいケースがあります。

米国の裁判所はMidjourneyに関する事件で、AIトレーニング段階での追跡と補償が困難であることを指摘しました。しかし、最近のAnthropic事件では、トレーニング用の書籍を中央データベースに集めて保存することは、著作権侵害の可能性があると判断しました。もしアップルが「意図的な侵害」とみなされれば、1冊あたり最大15万ドルの賠償金を支払う必要があるかもしれません。

現在、両教授は陪審員裁判、経済的損害賠償、そして今後アップルが自身の作品を使用することを禁止するよう求めています。アップル社は現在、訴訟の実質的な内容に対して公開的なコメントをしていません。訴状には、Apple Intelligenceの発表日にアップルの時価総額が2,000億ドル増加したことも記されていますが、過去5年間でアップルの時価総額は4回以上より高い伸びを示しており、この出来事による市場への影響はまだ見極める必要があります。

ポイント:

💼 学者たちはアップルを相手に、著作権なしに盗版本を使ってAIを訓練したとして訴えています。

📚 Books3は「影の図書館」として知られ、多くの著作権侵害の本のテキストが含まれています。

⚖️ 仮に「意図的な著作権侵害」と判定されれば、アップルは高額な賠償リスクに直面します。