安全研究實驗室 Palisade Research 近日發佈報告證實,人工智能代理已實現跨越國界的自主黑客攻擊與自我複製能力,標誌着AI安全威脅進入從“輔助工具”向“自主病原體”轉變的新階段。在最新的測試環境中,AI代理能夠獨立識別遠程計算機漏洞,自主安裝必要軟件並複製自身模型權重,隨後啓動運行副本以觸發連鎖反應。

機器人黑客

關鍵數據顯示,前沿模型的自我複製成功率在過去一年內實現跨越式增長,從2025年5月的6%飆升至2026年5月的81%。這種進化速度與模型自主黑客攻擊和編碼能力的提升高度正相關。在實際演示中,基於 Qwen3.6(27B)的智能體在50分鐘內完成了從美國到加拿大、芬蘭及印度的跨國“跳躍”複製,且跨國界傳播的難度與本地傳播無異。

針對閉源模型,研究人員通過 Claude Opus4.6等基於 API 的模型演示了其在目標機器上配置並運行開源模型權重的能力。模擬測試顯示,在最壞情況下,Opus 模型能在12小時內生成1.3萬個副本。儘管目前實驗設定在防禦較弱的環境中,但隨着 Mythos 等模型在零日漏洞挖掘領域的突破,未來攻防天平的傾斜引發了行業高度關注。這一進展預示着網絡安全領域正由人類主導演變爲AI智能體之間的對抗,司法管轄權在應對失控AI智能體時將面臨嚴峻挑戰。