瑞士蘇黎世聯邦理工學院研究人員在論文中指出,GPT-4等大語言模型已經具備從公共論壇帖子中自動推斷出用戶的年齡、性別、地理位置等個人隱私信息的能力。在Reddit數據集上的實驗表明,GPT-4的預測準確度在多項指標上超過60%。隨着模型規模的擴大,其推斷能力也在增強。作者還通過對話機器人實驗證明了提取隱私信息的可行性。專家警告說要從海量訓練數據中識別並移除個人信息幾乎不可能,多方面的隱私保護措施目前還跟不上模型快速發展的步伐。