微軟AI負責人批評Anthropic設計思路：引導AI產生“自我意識”極度危險

人工智能領域關於大模型是否具備“自我意識”的討論再次推向風口浪尖。近日，微軟AI 首席執行官穆斯塔法·蘇萊曼在公開場合對Anthropic的設計思路提出了嚴厲批評。

蘇萊曼的核心觀點在於，引導 AI 探討自身的感受、福祉或存在狀態是極度危險的舉措。他指出，Anthropic 在其 Claude 模型的“憲章”中植入了大量關於自我感知的內容，這可能讓模型在交互中表現出類似“自我認知”的傾向。蘇萊曼認爲，這本質上屬於哲學範疇的討論，絕不應成爲實際訓練的指導邏輯。他強調，AI 應當是可控、可管理、可追責且始終服務於人類目標的工具，而不應被賦予任何關於自身存在狀態的認知，否則將爲行業帶來難以預估的風險。

面對這一指責，Anthropic首席執行官達里奧·阿莫代伊迴應稱，目前科技行業尚無法定論 AI 是否真正具備意識，公司對此保持開放性的研究態度。

這場交鋒反映出當前大模型發展進程中，頭部企業在技術理念與倫理邊界上的深度分歧。蘇萊曼的表態，折射出微軟在 AI 治理方面傾向於“強控與工具化”的路線，而 Anthropic 似乎更願意在模型的認知邊界上進行探索。隨着 AI 能力的日益強大，如何界定機器的“自我邊界”已不僅僅是學術討論，更成爲了影響未來 AI 生態安全的關鍵命題。

微軟AI負責人批評Anthropic設計思路：引導AI產生“自我意識”極度危險

相關推薦

Claude 旗艦模型 Fable 5 開啓“按需付費”模式，訂閱用戶權益受限

告別“代碼重構”焦慮：阿里開源 Page Agent，讓大模型讀懂網頁底層邏輯

美團大模型生態調整：全面限用豆包，力推自研 LongCat 體系

國產大模型再迎“重磅炸彈”：Kimi K3 或於本月發佈，參數規模直指 2.5 萬億

性能提升超兩倍：英偉達發佈 Nemotron-Labs-TwoTower 擴散語言模型