在生成式人工智能向智能體(Agent)時代全速演進的過程中,越發強大的工具調用和聯網能力,也讓安全防禦的系統防線面臨着前所未有的考驗。爲了應對日益猖獗的提示注入攻擊,OpenAI 近日正式推出了一項極具破局意味的可選新安全設置——“封鎖模式”(Lockdown Mode),目前已面向所有已登錄用戶、不同賬戶類型及工作區全面開放。

所謂提示注入攻擊,一直是讓大模型研發團隊頭疼的黑客手段。攻擊者往往會將惡意指令巧妙地隱匿在網頁、第三方文檔或其他外部數據中。一旦 ChatGPT 在聯網狀態下讀取了這些被“下毒”的內容,就可能被誘導忽略原有的核心安全規則,執行越權操作,甚至在用戶毫無察覺的情況下,將輸入的商業機密或個人隱私等敏感信息祕密發送至外部惡意服務器。

面對這一業內公認的頑疾,OpenAI此次推出的封鎖模式,其底層設計思路非常務實。它並沒有試圖去完美識別所有層出不窮的惡意指令,而是選擇直接限制最危險、最關鍵的一環——切斷向外部發起網絡請求的通路。

一旦用戶或工作區管理員開啓了封鎖模式,ChatGPT 的諸多核心“大招”將受到物理級限制。其中,實時網頁瀏覽功能將被大幅削弱,系統僅能訪問受保護的緩存網頁內容,從而導致搜索結果可能出現不完整、過期或不可用的情況。同時,模型不會在回覆中檢索並展示任何來自外部網絡的圖片,也無法從網絡下載任何文件用於高級數據分析。

不僅如此,被視爲高階生產力代表的“深度研究(Deep Research)”和“智能體模式(Agent Mode)”將被直接關閉。即使是在 Canvas 畫布功能下生成的代碼,也無法獲得聯網訪問的批准。在這種模式下,大模型處理的文件僅限於用戶手動上傳的本地安全檔案。

不過,OpenAI官方也在幫助文檔中明確坦言,封鎖模式並非萬能的防彈衣,它無法百分之百保證提示注入攻擊徹底失效。因爲惡意指令依然有可能潛伏在合法的緩存網頁或用戶自行上傳的文件中,繼續幹擾模型的判斷。

這一新功能的上線,直觀地反映出當前 AI 產業所面臨的現實悖論:大模型的聯網權限越開放、自動化工具調用越深入,其暴露給外界的攻擊面也就越龐大。封鎖模式的推出,實際上是 OpenAI 明確爲 AI 能力劃定的一道安全邊界。它沒有開出“絕對安全”的空頭支票,而是選擇將“更強、更智能的協同體驗”與“更低的數據外泄風險”之間的天平砝碼,重新交還給用戶與企業管理員自己去權衡。