【AIbase報道】儘管 OpenAI 正在全力推廣其全新一代智能瀏覽器 ChatGPT Atlas,但公司內部安全主管 Dane Stuckey 近日卻公開表達了對其潛在安全風險的擔憂,引發業界關注。
Stuckey 指出,Atlas 面臨的最大挑戰之一是尚未徹底解決的 “即時注入”(Prompt Injection)攻擊。這類攻擊通過在網頁、郵件或其他內容中巧妙嵌入惡意指令,從而誘導 AI 代理執行非預期操作。其影響不僅可能干擾用戶的購買行爲,還可能導致電子郵件內容或登錄憑證等私人數據被竊取。

他坦言,儘管 OpenAI 已經開展了大規模安全測試,並在 Atlas 中引入多重防護機制與新的模型訓練方法,但“即時注入”仍然是一個棘手的開放性問題,短期內難以徹底根除。
爲緩解風險,OpenAI 在 Atlas 中部署了兩項關鍵防禦措施:其一是 “註銷模式”,用於在必要時阻斷 AI 代理對用戶數據的訪問,從源頭防止信息泄露;其二是 “監視模式”,適用於敏感網站,要求用戶在關鍵交互中進行人工確認和監督,以確保操作安全。
Stuckey 表示,團隊正在加速研發更多防護功能與快速響應系統,以便在面對潛在攻擊時能第一時間進行干預和修復。“Atlas 的安全挑戰不僅是技術問題,更是人與 AI 協作的新邊界測試。”他強調。
