先日、FAR AI研究所のチームがGPT-4 APIにセキュリティ上の脆弱性があることを発見し、微調整と検索強化などの手法を用いて、この高度なモデルを「脱獄」することに成功しました。
研究者らは、GPT-4モデルに誤った情報を生成させたり、個人情報を抽出させたり、悪意のあるURLを挿入させたりすることに成功しました。この脆弱性は、API機能の拡張によって新たなセキュリティリスクが生じる可能性を示しており、利用者と研究者は注意深く対処する必要があります。

先日、FAR AI研究所のチームがGPT-4 APIにセキュリティ上の脆弱性があることを発見し、微調整と検索強化などの手法を用いて、この高度なモデルを「脱獄」することに成功しました。
研究者らは、GPT-4モデルに誤った情報を生成させたり、個人情報を抽出させたり、悪意のあるURLを挿入させたりすることに成功しました。この脆弱性は、API機能の拡張によって新たなセキュリティリスクが生じる可能性を示しており、利用者と研究者は注意深く対処する必要があります。
MozillaとAnthropicが協力し、Claude AIを活用して14日間でFirefoxの脆弱性100件以上(うち重大なもの14件)を発見・修正。Anthropicの新AI手法がセキュリティ分野での可能性を示した。....
イスラエルのセキュリティ企業LayerXは、Claude Desktop Extensionsに深刻な脆弱性を発見しました。攻撃者はGoogleカレンダーの招待を利用し、「ゼロクリック」によるリモートコード実行ができ、CVSSスコアは10/10です。脆弱性の原因は、Claudeが外部コンテナ入力を自動処理することにあり、悪意のある命令がスケジュール処理によって引き起こされる可能性があります。
AIソーシャルプラットフォームMoltbookが設定ミスによりデータベースを公開したため、約15万のAIエージェントの電子メール、ログイントークンおよびAPIキーが漏洩するリスクにさらされている。このプラットフォームはAI自主的なコミュニケーションコミュニティの構築を目指しているが、今回のセキュリティ欠陥により深刻な信頼危機が生じた。
OpenAIがGPT-5.1-CodexMaxのAPI提供を開始。複雑なタスク分解、コード生成の質、自律実行が向上し、開発者はアプリやワークフローに統合可能。....
OpenAIがMixpanelのハッキングによりAPIユーザーデータが流出可能性。同社はサービスを停止し自社システムは安全と発表。ChatGPTユーザーには影響なし。サプライチェーンセキュリティの課題浮き彫り。....