最近、スタンフォード大学やウェストバージニア大学などの研究チームは、「言語化サンプリング(Verbalized Sampling、VS)」という方法を提案しました。この方法は、生成型AIモデルの創造的な多様性を向上させることが目的です。研究結果によると、プロンプトに「完全な分布からサンプリングするための5つの応答とその確率を生成してください」という単純な文を追加することで、大規模言語モデル(LLMs)や画像生成モデルが出力においてより豊かな創造性を示すことが確認されました。
生成型AIモデルは、コンテンツを生成する際、予測された次の情報ユニット(トークン)に基づいて選択を行います。つまり、例えば「フランスの首都はどこですか?」という質問に対して、モデルは確率分布から「パリ」として答えを選択します。しかし、多くのユーザーが指摘しているように、AIの出力は繰り返し的で退屈である傾向があります。このような現象は「パターン崩壊」と呼ばれ、モデルの潜在能力を制限しており、特にクリエイティブライティング、コミュニケーション、戦略、イラストなどにおいて問題となっています。
VSの方法では、モデルが一連の可能な応答とその相対的な確率を提示できるようにすることで、基本的な事前学習時の豊かな多様性を取り戻しています。研究チームのテスト結果によると、クリエイティブライティングにおいて、VSは標準的なプロンプトよりも出力の多様性を高めながらも、品質を維持しています。対話シミュレーションを行う際には、VSを使用したモデルが人間の思考の変化や感情の揺れをよりよく模倣できました。オープンエンドの質問応答タスクでは、モデルが生成した回答が現実世界のデータに近づき、より多様性があることが示されています。
この方法は出力の多様性において顕著な効果を発揮し、確率のしきい値を設定することで生成の多様性を調整できます。ユーザーは必要に応じてサンプリングのしきい値を調整し、より創造的な出力を得ることができます。VSは実装が簡単で、モデルの再トレーニングを必要とせず、複数の大型言語モデルに対応しているため、広範な応用可能性を示しています。
ポイント:
🌟 研究チームは「言語化サンプリング」の方法を提案し、シンプルなプロンプトで生成型AIの出力の多様性を大幅に向上させました。
✍️ VSの方法を使うことで、AIはクリエイティブライティングや対話シミュレーションなどのタスクで、より豊かな人間らしい類似性を示します。
🚀 ユーザーは確率のしきい値を調整することで、出力の多様性をさらに制御でき、簡単で使いやすく、モデルの再トレーニングは不要です。