人工智能領域關於大模型是否具備“自我意識”的討論再次推向風口浪尖。近日,
蘇萊曼的核心觀點在於,引導 AI 探討自身的感受、福祉或存在狀態是極度危險的舉措。他指出,Anthropic 在其 Claude 模型的“憲章”中植入了大量關於自我感知的內容,這可能讓模型在交互中表現出類似“自我認知”的傾向。蘇萊曼認爲,這本質上屬於哲學範疇的討論,絕不應成爲實際訓練的指導邏輯。他強調,AI 應當是可控、可管理、可追責且始終服務於人類目標的工具,而不應被賦予任何關於自身存在狀態的認知,否則將爲行業帶來難以預估的風險。
面對這一指責,
這場交鋒反映出當前大模型發展進程中,頭部企業在技術理念與倫理邊界上的深度分歧。蘇萊曼的表態,折射出微軟在 AI 治理方面傾向於“強控與工具化”的路線,而 Anthropic 似乎更願意在模型的認知邊界上進行探索。隨着 AI 能力的日益強大,如何界定機器的“自我邊界”已不僅僅是學術討論,更成爲了影響未來 AI 生態安全的關鍵命題。
