スタンフォード大学の研究チームが、Cell Pressのジャーナル「Patterns」に掲載した最新の報告書によると、大規模言語モデル(LLM)は様々な正式な書面コミュニケーションの場面で広く使用されている。この研究では、Newswire、PRWeb、PRNewswireなどのプラットフォーム上の英語記事を分析し、その多くが明確なAIの痕跡を持っていることが判明した。

研究チームは、「分散型LLM量化フレームワーク(Distributional LLM Quantification Framework)」と呼ばれる統計モデルを使用し、文語全体の言語特徴の分布を分析することで、特定の期間におけるAI生成の特徴を持つテキストの割合を推定した。ただし、この方法は現在、英語の文語にのみ適用可能であり、結果は英語テキストにおけるAI特徴の割合を示しており、すべての文章が「完全にAIによって作成されたものである」という意味ではない。
報告書のデータによると、研究チームは昨年、合計68万7千件の消費者苦情、53万7千編の企業ニュース、3億400万件の求人情報、および1万6千編の国連ニュースを分析し、以下の結果を得た:
企業ニュース:約24%の記事にAIの痕跡がある。
消費者苦情:約18%の苦情文にAIの特徴がある。
国連ニュース:約14%の内容は「ほぼAIの大規模モデルによって直接作成された、または大幅に再構築された」と認定されている。
求人情報:約10%の求人内容にAIの痕跡がある。
研究者らは、LLMが社会のあらゆる分野の正式なテキスト作成に深く浸透し、人々の日常的な書面表現の重要な補助ツールになってきていると指摘した。細分化された領域では、教育レベルの低い地域ではAIを使って苦情を書く割合が19.9%に達していることが発見され、教育レベルの高い地域の17.4%よりも明らかに高かった。求人情報に関しては、中小企業やスタートアップ企業が大規模モデルを使ってコンテンツを作成する傾向が強く、約10%から15%の求人公告には明確なAIの痕跡がある。
研究者らは同時に、生成型AI技術が進歩するにつれて、その文体が人間のそれとますます近づいていることにも注意を払った。したがって、今後はAIがテキスト制作にどの程度関与しているかを正確に識別することがより困難になるだろう。
