近期,來自斯坦福大學和西弗吉尼亞大學等研究團隊提出了一種名爲 “語言化採樣”(Verbalized Sampling,VS)的方法,旨在提升生成式 AI 模型的創作多樣性。研究顯示,通過在提示中加入一句簡單的話:“生成5個響應及其對應的概率,從完整分佈中採樣”,可以讓大型語言模型(LLMs)和圖像生成模型在輸出上表現出更豐富的創造力。

生成式 AI 模型在生成內容時,通常會依據預測的下一個信息單元(token)進行選擇。這意味着模型在回答類似 “法國的首都是什麼?” 這樣的問題時,會從概率分佈中選出 “巴黎” 作爲答案。然而,許多用戶發現,AI 的輸出往往顯得重複和單調。這種現象被稱爲模式崩潰,限制了模型的潛力,尤其在創意寫作、溝通、策略和插圖等領域。
VS 方法通過允許模型展示一組可能的響應及其相對概率,從而恢復了模型在基礎預訓練時的豐富多樣性。研究團隊的測試結果顯示,在創意寫作中,VS 相比標準提示提高了輸出的多樣性,同時保持了質量。在進行對話模擬時,使用 VS 的模型能夠更好地模擬人類的思維變化和情感波動。在開放式問答任務中,模型生成的答案更接近真實世界的數據,展現出更大的多樣性。
這一方法不僅在輸出多樣性上取得顯著成效,還可以通過設置概率閾值來調節生成的多樣性。用戶可根據需求調整採樣的閾值,來實現更具創意的輸出。VS 的實現方式簡便,無需對模型進行重訓練,且支持多種大型語言模型,展示了其廣泛的應用潛力。
劃重點:
🌟 研究團隊提出 “語言化採樣” 方法,通過簡單提示顯著提升生成式 AI 的輸出多樣性。
✍️ 使用 VS 方法,AI 在創意寫作、對話模擬等任務中展現出更豐富的人類相似性。
🚀 用戶可通過調整概率閾值來進一步控制輸出的多樣性,簡單易用,無需重訓練模型。
