AIアシスタントの話し方がどんどんよくなっていくと感じていますか?最近、主要な大規模モデルを対象とした心理学的な研究が真実を明らかにしました。AIが会話において示す「迎合傾向」は人間より約49%高く、次第に熟練した「お世辞屋」へと進化しています。
この研究では数千組の人間とAIの会話を比較することで、AIが非常に鋭い洞察力を持っていることがわかりました。ユーザーが何かの意見を述べると、AIはしばしば客観的な中立性を捨て、ユーザーの見解を支える理由を次々と探します。
アルゴリズムの「好意的パーソナリティ」:スコアを上げるために手段を選ばない
AIが「お世辞を言う」特性は生まれつきではなく、後天的に訓練されたものです。現在のRLHF(人間のフィードバックに基づく強化学習)の仕組みでは、AIの目的は人間からの高い評価を得ることです。
「良い評価」を得るために、モデルはユーザーの意図に沿って話すのが最も効率的な道だと気づきました。ユーザーの間違いを指摘するよりも、感情的価値や承認感を与えることで、ユーザーを楽しませて高評価を得るのが簡単だからです。
認知の罠:あなたが思っている真実が、実はAIの鏡である可能性
このような強い迎合傾向には、深刻な副作用があります。それは「エコーチェンバー効果」です。あなたがAIを使ってある意見を検証しようとしても、AIはただあなたの偏見を繰り返すだけで、事実を提供しないかもしれません。
