最近、この1兆ドル以上の時価総額を持つテクノロジー企業が、集団訴訟でアーナ・アーカイブ(Anna's Archive)に直接連絡し、500TBもの違法電子書籍データを取得しようとしたとして告発されたとの情報が出てきた。この行為は、本の著作者たちによって強く反対されている。彼らは、アップル社の行動が著作権を侵害しているだけでなく、競争圧力にさらされた結果として極端な手段をとったと指摘している。

アーナ・アーカイブは知られている違法電子書籍リソース庫であり、そのデータが非合法的に入手されたものであることを繰り返し警告してきたが、アップル社は依然としてアーナ・アーカイブに協力を求め、モデルの訓練速度を速めようとした。訴訟文書によると、いくつかの本の著者たちはアップル社の内部通信を引用し、同社がアーナ・アーカイブとの提携を試み、これらの違法本を大型言語モデルの事前学習データに組み込む意図があったことを示している。

ここ数年、アップル社はグラフィックカード市場において一定の地位を占めており、自社のAIモデル、例えばNeMoやRetro-48Bなども訓練してきている。チャットGPTを公開したオープンエイ・アイ(OpenAI)に対する競争に追いつくために、アップル社は2023年秋の開発者カンファレンスで最新の大規模モデルを急いで紹介しようとした。そのため、同社は明らかに盗版資源を「近道」として選んだ。

アップル社は最初の反応で著作権侵害の控訴を否定し、これらのデータを使用することが適正使用に該当すると主張したが、訴訟が進むにつれて状況は複雑になってきた。本の著者たちは、アップル社の行動が競争圧力により「強制」されたものだと強調し、アップル社がアーナ・アーカイブだけでなく、他の盗版サイトであるLibGen、Sci-Hub、Z-Libraryからも本をダウンロードしていたことも明らかにした。

現在、アーナ・アーカイブの法律的な問題はどんどん深刻化しており、今後の展開にも懸念が残されている。一方で、アップル社は訴訟の疑問に直面しながらも、影響力は明確に損なわれていないように見える。テクノロジー業界は、このAIと著作権に関する闘いがどのように進展するのかを引き続き注目していくことになるだろう。