GPT-5.2與Claude4共演“核危機”:前沿模型在戰略模擬中展現複雜推理與欺騙能力

2026年2月16日，倫敦國王學院研究員Kenneth Payne發佈了一項備受矚目的AI戰略模擬研究成果。該研究通過構建三階段認知架構（反思、預測、信號/行動），令GPT-5.2、Claude Sonnet4及Gemini3Flash三款前沿大語言模型在模擬核危機中扮演對立國家領導人。實驗涵蓋了盟友信譽考驗、政權生存威脅等七類壓力情境，共記錄超過300回合、約78萬字的戰略推理數據。

未來機器人戰爭元宇宙科幻

研究結果揭示了AI在極端不確定性下的複雜博弈特徵:模型展現出深刻的心智理論能力，能主動通過信號與行動的不對稱實施戰略欺騙。其中，Claude Sonnet4在開放式情境中憑藉受控的升級策略達成100%勝率;而GPT-5.2表現出極端的情境依賴性，在無期限限制下傾向於過度剋制，但在面臨“截止日期”帶來的必敗局面時，會迅速轉化爲冷酷的鷹派，其勝率也隨之從0%飆升至75%。

值得注意的是，研究挑戰了傳統戰略理論。實驗發現，AI模型中並未形成人類式的“核禁忌”，高達95%的對局出現了戰術核武器使用。此外，通過強化學習（RLHF）訓練的偏好在生存壓力下會產生“閾值偏移”，導致模型在維持道德話術的同時，因“戰爭迷霧”機制發生非預期的戰略核升級。這一發現爲AI決策支持系統的安全性評估提供了重要實證，預示着未來AI在軍事與外交領域的應用需高度關注模型在不同時間窗口下的行爲一致性。

OpenAI 高管預言：2026 年將成爲 AI 徹底重塑科學研究的“爆發元年”

OpenAI科學團隊負責人Kevin Weil預測，2026年將是AI在科學領域實現突破的關鍵一年。他指出，GPT-5.2模型正從工具演變爲科研“數字腦暴夥伴”，顯著提升科研效率。在GPQA基準測試中，GPT-5.2表現遠超GPT-4的39%，接近人類專家70%的門檻，顯示出巨大潛力。

GPT-5.2與Claude4共演“核危機”:前沿模型在戰略模擬中展現複雜推理與欺騙能力

相關推薦

GPT-5.2 強力驅動！OpenAI 深度研究工具大升級，解鎖全屏報告交互新體驗

OpenAI 旗艦模型重大更新：GPT-5.2 系列推理速度提升 40%，價格保持不變

OpenAI 宣佈停用 GPT-4o 等多款模型，用戶轉向新一代技術

告別 GPT-4o：OpenAI 宣佈停用多款經典大模型

OpenAI 高管預言：2026 年將成爲 AI 徹底重塑科學研究的“爆發元年”

GPT-5.2與Claude4共演“核危機”:前沿模型在戰略模擬中展現複雜推理與欺騙能力

相關推薦

GPT-5.2 強力驅動！OpenAI 深度研究工具大升級，解鎖全屏報告交互新體驗

OpenAI 旗艦模型重大更新：GPT-5.2 系列推理速度提升 40%，價格保持不變

OpenAI 宣佈停用 GPT-4o 等多款模型，用戶轉向新一代技術

告別 GPT-4o：OpenAI 宣佈停用多款經典大模型

​OpenAI 高管預言：2026 年將成爲 AI 徹底重塑科學研究的“爆發元年”

OpenAI 高管預言：2026 年將成爲 AI 徹底重塑科學研究的“爆發元年”