Anthropic 公司正在力推其大型語言模型(LLM)在網絡安全領域的巨大潛力,並以實戰數據證明了 AI 在發現軟件漏洞方面的快速進步。公司引用 CyberGym 排行榜的結果,表明其最新的模型在提高網絡防禦效率方面邁出了關鍵一步。
核心數據顯示,Claude Sonnet4在發現新軟件漏洞的概率約爲2%,而其升級版 Sonnet4.5的這一概率已大幅提升至5%。更值得關注的是,在反覆進行的測試中,Sonnet4.5在超過三分之一的項目中成功發現了新的漏洞,展示了其作爲一個**“漏洞發現引擎”**的強大實力。
Anthropic 認爲,這種性能飛躍標誌着 “人工智能影響網絡安全的轉折點”。
公司進一步指出,在最近的 DARPA 人工智能網絡挑戰賽中,參賽團隊已經開始利用 Claude 等大型語言模型,構建出先進的**“網絡推理系統”。這些系統能夠高效地檢查數百萬行代碼**,以尋找並定位那些需要修補的關鍵漏洞。
Anthropic 的數據和觀察表明,LLM 不再僅僅是內容生成工具,它們正迅速成爲網絡安全領域不可或缺的分析和防禦力量,有望從根本上改變軟件漏洞的發現和修復流程。