Salesforce社は、xGenシリーズの大規模言語モデルが盗作の書籍を使用してトレーニングされたとして、2人の小説家から集団訴訟を受けた。この訴訟は10月15日にサンフランシスコの米国地方裁判所で提起され、原告のモリー・タンザー(Molly Tanzer)とジェニファー・ギルモア(Jennifer Gilmore)は、Salesforceが著作権保護された大量の書籍データセットを無許可でダウンロード、保存、複製し、AIモデルを開発するために使用したと主張している。
この出来事は孤立したケースではない。AI業界では類似の著作権侵害の指摘が頻繁に見られる。先月には、生成型AI企業Anothropicも数百万冊の盗作書籍を用いてモデルをトレーニングしたとして、15億ドルの和解を達成した。これについて、イリノイ大学シカゴ校のデータサイエンスおよびAI戦略副学長マイケル・ベネット(Michael Bennett)は、Salesforceの事件とAnothropicの事件は非常に似ていると述べた。Anothropicの事件では、裁判所が合法的に入手した作品をモデルトレーニングに使用することは「適正利用」に該当すると裁定したが、不法に入手した作品はその保護を受けていない。
現在、Salesforceの事件は、Anothronicの和解結果のように和解で解決される可能性が高い。RPA2AIの創設者兼アナリストのカシップ・コンペラ(Kashyap Kompella)は、この出来事は著作権所有者が法的に一定の交渉力を持っていることを示しており、トレーニングデータの出所問題は商業的問題であり、同時に法的問題でもあると考えている。
さらに、この訴訟はSalesforceに対してさらなる悪影響を及ぼす可能性があり、特に企業顧客がそのモデルやトレーニングデータセットへの信頼感に疑問を抱くことになるだろう。コンペラは、企業顧客がAIサプライヤーが使用するデータソースが許諾されており、監査可能で合理的であることを確認することが重要であると強調した。
同様の訴訟は、より広範なAI技術の応用を妨げる要因となる可能性がある。企業がAIサプライヤーを選択する際には、トレーニングデータの出所と関連する賠償条項を深く理解することが不可欠である。
ポイント:
- 📚 Salesforceは盗作書籍を用いてAIモデルをトレーニングしたとして訴えられている。
- ⚖️ この事件は、Anothropicの事件と同じように和解で解決される可能性がある。
- 🔍 企業顧客はAIモデルへの信頼感が損なわれる可能性があり、データソースの合法性を確保する必要がある。