ネルソン傘下のメタデータサービス大手グレースノートは、米国ニューヨーク南地区連邦裁判所に正式に提訴し、OpenAIが未承諾かつ無償でその特有なメディアメタデータベースを大量に収集し、ChatGPTなどの商用AI製品のトレーニングに使用したことを控訴した。
グレースノートは、OpenAIの行動が深刻な著作権侵害であり、会社のビジネスの基盤を直接的に脅かしていると主張している。グレースノートは、そのデータベースが数百人の編集者が人為的にラベリングしており、詳細な番組概要、ビデオの特徴、ユニークな識別子および複雑な関係グラフを含んでいると指摘している。企業は、著作権侵害されているのは文字だけでなく、特許的な「データ関連フレームワーク」も含まれていると強調している。
訴状には、ユーザーが『ゲーム・オブ・スローンズ』などの人気テレビドラマを説明するよう求めた際、AIが出力する内容がグレースノートの編集者が作成した概要とほぼ完全に一致しているという証拠が示されている。これは関連データが直接コピーされモデルに組み込まれていることを示している。
グレースノートは、AI会社がこれらのデータを無料で収集して提供できる場合、スマートテレビメーカーなどのエンドユーザーがライセンスサービスを購入しなくなり、代わりにAI生成の代替品に依存してしまうことで、メタデータ市場の生態系が崩壊してしまうことを懸念している。グレースノートは、以前から何度もOpenAIに対してライセンスについて交渉を試みたが、長期にわたって拒否または無視されており、最終的に法的手段を取ることになったと述べている。
これに対して、OpenAIのスポークスパーソンは、モデルのトレーニングが「公開されたデータに基づいており」、現在の著作権法における「適正利用」の原則に合致していると応じた。
