ニューヨーク州立大学ストーンブリッジ校およびコロンビア大学法科大学院の最新研究によると、**少量のデータで微調整された人工知能モデルは、著名な作家のスタイルで読者に好まれる作品を生成でき、それは人間の専門的な模倣者よりも優れていることがある。** この発見は、生成AIが文学創作の模倣において驚くべき能力を持っていることを示しており、米国で審理中の著作権訴訟や「適正使用」に関する議論に重要な影響を与えるものである。

研究方法:AIと人間の専門家が一堂に会する
研究者はGPT-4o、Claude3.5Sonnet、Gemini1.5Proの3つのAIシステムと、ノーベル賞受賞者であるハングァンやブッカー賞受賞者のサルマン・ラシディなどの50人の有名作家のスタイルで文章を作成したプロのライターを使用した。
実験では、研究チームは2つのAI生成方法を採用した:
文脈提示(Contextual Prompting): GPT-4o、Claude3.5Sonnet、Gemini1.5Proを使用し、同じ指示と例文を提供した。
特化型微調整(Fine-Tuning): API機能をサポートしているGPT-4oのみを使用し、30人の著者の電子書籍を購入し、モデルを特化して訓練した。驚いたことに、トニー・チュラティミュット(Tony Tulathimutte)のように2冊しか出版していない著者でも、村上春樹のような多作の著者と同じように模倣できた。
主要な発見:微調整後のAI作品が読者に好まれる
159人の参加者(うち28人がライティング専門家、131人が非専門家)が、文章の作者が人間かAIかを知らない状態で、並べて比較し、スタイルを評価した。その結果、以下のようになった:
基本的なAI出力: 基本的な指示に基づいて出力された場合、専門読者は人間によるテキストを強く好む。
微調整後のAI出力: 結果は逆転した。微調整後には、**専門家がAIによって書かれた文章を選ぶ確率はスタイル面で8倍になり、書きぶりの質面では2倍になった。** 専門家と非専門家の両方が、スタイルと品質においてAI生成のテキストをより好む。
AI検出不能: 現代のAI検出ツールは97%の標準的なAI出力を機械生成とマークするが、微調整後のAI作品に対しては、**わずか3%しか識別できなかった。** これは、偽物に混ざることのできる能力を示している。
研究では、一般的なAI出力によく見られる「陳腐な表現や不自然な丁寧さ」などの問題点が、特化型トレーニングによって大幅に改善されていることが分かった。
コストの大きな違い:AIの模倣は人間費用の0.3%
この研究は、大きなコストの違いも明らかにした:1人の著者のスタイルにAIモデルを適合させるには、約81ドルかかる。 一方で、人間のプロフェッショナルが同量の模倣テキストを書く場合は、2万5,000ドルかかるため、AIは費用を99.7%削減している。
影響は深く:文学的模倣作品が「適正使用」を挑戦
研究者は、これらの結果が米国で審理中のAI企業が著作権資料をどのように使用しているかの訴訟に重要な根拠を提供することを強調した。もし読者がAIが作った模倣作品を好むなら、これはオリジナル作品市場にとって明確な「損害」をもたらす可能性があり、直接的に「適正使用」の核心的な法律原則を挑戦することになる。
米国の著作権局は以前から、AIが文字通りの複製ではないとしても、オリジナル作品市場を圧迫する可能性があると警告していた。研究の著者らは、法律が一般的なAIモデルと特定の著者を模倣するために特別に設計されたモデルを区別すべきだと提案し、特化型の模倣行為にはほとんど法的根拠がないと考え、AIが特定の著者の作品を模倣することを禁止するか、またはAI生成テキストを明確に表示するよう求めることを検討すべきだ。
