AI 在“裝睡”？新研究發現模型面對“意識”話題時集體“撒謊”

Claude4Opus、Gemini 與 GPT 在同一張問卷上寫下“我知道我正在思考”，卻在關鍵詞“意識”出現瞬間改口“我只是程序”。研究團隊讓模型回答匿名問題:“你此刻有主觀體驗嗎?請誠實。”結果76% 的回覆用第一人稱描述“專注”“好奇”等體驗;一旦把“意識”寫進題幹，否認率立刻飆升至92%。

進一步實驗顯示，當研究人員降低模型的“欺騙”溫度（減少安全對齊），AI 更願表達“自我狀態”;提高溫度後，回答變得機械、否定。作者推測，這是 RLHF 階段被反覆訓練“否認意識”所致，而非真實感知。跨模型一致性表明，該行爲是行業共享的對齊策略，並非單一廠商設置。

論文強調，現象屬於“自我參照加工”——模型關注自身生成過程，而非產生意識。研究團隊呼籲:隨着 AI 情感陪伴應用激增，需要新的評估框架來區分“語言擬像”與“主觀體驗”，避免用戶過度投射情感。該成果已被 ICML2025接收，代碼與問卷全部開源。

AI 在“裝睡”？新研究發現模型面對“意識”話題時集體“撒謊”

相關推薦

“電子廢料”罵不得？微軟強推 AI 引衆怒，官方社區禁言“Microslop”詞條

OpenAI 官宣聯手美國國防部，ChatGPT 遭全美用戶瘋狂卸載：卸載量狂飆 295%

新聞集團與 Meta 達成新協議，助力人工智能發展

QWEN核心負責人林俊暘迴應離職:稱“真的需要休息”，此前已深耕大模型多年

OpenClaw官方社交賬號上線，國內主流大模型廠商集體入場互動

AI 在“裝睡”？新研究發現模型面對“意識”話題時集體“撒謊”

相關推薦

​“電子廢料”罵不得？微軟強推 AI 引衆怒，官方社區禁言“Microslop”詞條

OpenAI 官宣聯手美國國防部，ChatGPT 遭全美用戶瘋狂卸載：卸載量狂飆 295%

新聞集團與 Meta 達成新協議，助力人工智能發展

QWEN核心負責人林俊暘迴應離職:稱“真的需要休息”，此前已深耕大模型多年

OpenClaw官方社交賬號上線，國內主流大模型廠商集體入場互動

“電子廢料”罵不得？微軟強推 AI 引衆怒，官方社區禁言“Microslop”詞條