Anthropic社は、大規模言語モデル(LLM)がサイバーセキュリティ分野における大きな潜在力を有していることを推進しており、実際のデータをもとにAIがソフトウェアの脆弱性を発見する能力が急速に向上していることを示しています。同社はCyberGymランクインの結果を引用し、最新モデルがネットワーク防御効率の向上において重要な一歩を踏み出していることを示しています。

主要データによると、Claude Sonnet4は新しいソフトウェアの脆弱性を発見する確率は約2%ですが、アップグレード版のSonnet4.5ではこの確率は5%まで大幅に向上しています。さらに注目すべきは、繰り返し行われたテストで、Sonnet4.5は3分の1以上のプロジェクトで新たな脆弱性を発見したことです。これは、「脆弱性発見エンジン」としての強力な実力を示しています。
Anthropic社は、この性能の飛躍が「人工知能がサイバーセキュリティに与える転換点」であると認識しています。
また、会社は最近のDARPAの人工知能ネットワークチャレンジで、参加チームがClaudeなどの大規模言語モデルを活用し、高度な「ネットワーク推論システム」を構築したと述べています。これらのシステムは、数百万行のコードを効率的にチェックし、修復が必要な重要な脆弱性を発見・特定することができます。
Anthropic社のデータと観察により、LLMは単なるコンテンツ生成ツールではなく、今やサイバーセキュリティ分野で不可欠な分析・防御の力となっており、ソフトウェアの脆弱性の発見および修正プロセスを根本的に変える可能性を秘めています。
