近日,來自斯坦福大學、華盛頓大學和谷歌 DeepMind 的研究團隊開發了一種新型的人工智能(AI)智能體,這些智能體可以在社會實驗中精準模擬人類行爲。根據他們的研究,這種模擬技術有望爲經濟學、社會學、組織學和政治學等領域的理論測試提供實驗室基礎。
研究人員構建這些 AI 智能體的過程中,使用了超過1,000名美國選民的訪談數據。這些被訪者的年齡、性別、教育背景和政治觀點均代表了美國社會的多樣性。AI 智能體通過分析這些訪談記錄,利用 GPT-4o 模型,在用戶提問時再現受訪者的真實反應。
在具體實現上,研究團隊爲每位參與者進行了兩小時的深度訪談,並使用 OpenAI 的 Whisper 模型將訪談內容轉換爲文本。這一方法極大地提高了 AI 智能體的準確性。在對人類行爲的預測測試中,基於訪談數據的 AI智能體以85% 的準確率成功預測了人類在一般社會調查中的回答,表現明顯優於僅依賴基本人口統計信息的 AI 代理。
研究者們還進行了五項社會科學實驗,結果顯示在四項實驗中,AI 智能體所產生的結果與人類參與者的反應高度一致,相關係數達到了0.98。這說明基於訪談的方法在不同政治意識形態和種族羣體的響應分析中表現出更高的準確性和更好的平衡性。
爲了促進後續研究,研究團隊將其創建的1,000個 AI 智能體的數據集上傳至 GitHub,供其他科學家使用。爲了保護參與者隱私,團隊採用了兩級訪問系統。
科學家可以自由獲取某些特定任務的綜合響應數據,而對開放式研究中個體響應數據的訪問則需要特殊權限。這一系統旨在在保護原始訪談參與者隱私的同時,幫助研究人員更好地研究人類行爲。
項目入口:https://github.com/joonspk-research/genagents
劃重點:
🌟 研究團隊開發的 AI 智能體基於訪談數據,能夠準確模擬人類行爲,提升社會科學研究的準確性。
📊 AI 智能體在社會調查中的預測準確率達到85%,明顯優於僅依賴人口統計信息的智能體。
🔍 數據集已公開,其他研究人員可通過 GitHub 訪問,促進人類行爲研究,同時保護參與者隱私。