研究表明,大型預訓練語言模型(LLM),如GPT-3,具有出色的能力,可以理解和回答人類提出的問題,協助編碼工作等。最近,研究人員引入了RAIN方法,使LLM能夠自我評估和改進,無需額外數據和微調。這一方法不僅提高了LLM的性能,還降低了對敵對攻擊的成功率,爲AI生成更協調和安全的響應。這項研究爲調整LLM以滿足人類偏好提供了一種新的方法,無需額外信息或繁瑣的微調。