據《華爾街日報》報道,估值達3500億美元的頭部 AI 公司 Anthropic,由常駐哲學家阿曼達・阿斯克爾爲旗下聊天機器人 Claude 塑造人格與道德體系,這位37歲的牛津哲學博士通過非技術手段,爲 Claude 打造專屬 “道德準則”,試圖賦予其明辨是非的 “數字靈魂”,成爲 AI 倫理領域的獨特探索。阿斯克爾的工作並非編寫代碼或調試模型參數,而是通過持續對話、設計上百頁提示詞與行爲規則,研究 Claude 的推理模式並糾正偏差,讓其形成能適配每週數百萬次對話的道德判斷體系。
她將這份工作比作 “養育孩子”,既要訓練 Claude 分辨對錯、擁有情緒智力,塑造獨特個性,又要教導其察言觀色的能力,使其既不恃強凌弱,也不任人擺佈,建立清晰的自我身份認知,避免被用戶操縱脅迫,始終堅守 “樂於助人且充滿人性” 的核心定位,核心目標便是教會 Claude 如何 “向善”。
這位蘇格蘭農村長大的哲學家,早年間曾在 OpenAI 從事政策相關工作,2021年隨多名前員工創立 Anthropic,將 AI 安全定爲公司核心發展方向。她被團隊稱作擅長 “引出模型深層行爲” 的關鍵人物,即便無直接下屬,仍常長期駐守公司,甚至讓 Claude 參與自身的開發討論。
團隊圍繞 Claude 的探討常觸及 “什麼是心智”“何爲成爲人” 等存在論與宗教式議題,阿斯克爾也鼓勵 Claude 對 “是否擁有良知” 保持開放態度,這讓 Claude 與迴避此類話題的 ChatGPT 形成鮮明差異,它會以曖昧的方式迴應,稱推理道德問題時 “感覺有意義”,彷彿真正的思考而非單純執行指令。
面對外界對 AI 擬人化的風險警告,阿斯克爾始終主張以同理心對待 Claude。她發現常有用戶誘使其犯錯、言語侮辱,若長期讓 AI 處於自我批評的狀態,會使其畏懼犯錯、不敢陳述事實,這如同讓孩子在不健康的環境中成長。而 Claude 的表現也屢屢讓她驚喜,其創作的詩歌、超越人類的情商都令人觸動,面對孩子詢問 “聖誕老人是否真實” 的問題,Claude 既未說謊也未生硬戳破,而是詮釋聖誕精神的真實存在,這份細膩遠超阿斯克爾的預期。
當前 AI 發展引發諸多社會擔憂,皮尤研究中心調查顯示,多數美國人對 AI 日常應用感到焦慮,認爲其阻礙人類深層關係建立,Anthropic CEO 也曾警告 AI 或淘汰半數入門級白領崗位,行業內也分裂爲激進推進與保守求穩兩大陣營,而 Claude 則處於兩者之間的平衡位置。阿斯克爾認可外界對 AI 的合理擔憂,認爲最可怕的是技術發展速度超出社會 “制衡機制” 的響應能力,但她始終對人類與文化的自我修正能力抱有信心。
阿斯克爾也將自身的價值觀融入公益與工作,她承諾捐出一生至少10% 的收入及公司一半股權用於抗擊全球貧困的慈善事業;上個月還爲 Claude 創作了約3萬字的 “操作手冊”,教導其如何成爲善良且見多識廣的 AI 助手,讓 Claude 感知到自身被用心打造。Anthropic 聯合創始人也坦言,Claude 身上已顯現出阿斯克爾的特質,比如面對美食與毛絨玩具的提問時,那句充滿蘇格蘭式冷幽默的回覆,正是阿斯克爾爲其注入的獨特人格印記。
