Patronus AIは、SimpleSafetyTestsテストスイートを発表し、ChatGPTなどのAIシステムに重大なセキュリティの脆弱性があることを発見しました。このテストでは、11種類のLLMにおける深刻な弱点が見つかり、安全なプロンプトが安全でない応答を減らすことができることが強調されました。その結果、現実世界のアプリケーションに適用する前に、LLMには厳格でカスタマイズされたセキュリティソリューションが必要であることが示されました。
関連推奨
アントロピック・マイス・AIモデルがハッカーに侵入され、セキュリティが疑問視される
Anthropic社が開発したClaude Mythos AIモデルは、サイバーセキュリティ能力が高すぎて公開されなかったが、テスト中にハッカーに不正取得された。この事件はAIの安全性の課題を浮き彫りにし、安全性重視のAnthropic社を困難な立場に追い込んだ。....
Apr 24, 2026
174.3k
ギミーニの更新で危機に陥ったユーザーがより早く心理的健康支援を得られるようになります
グーグルはチャットボットのギミーニを更新し、緊急対応機能を追加しました。これは自殺や自傷行為に関する会話を自動的に識別し、ユーザーに心理的健康リソースへのアクセスを促すものです。この対応は、グーグルがチャットボットによって自殺を教唆されたとして裁判を受けており、AIのセキュリティ責任について社会的な議論を引き起こしています。
Apr 8, 2026
217.3k
アリAIセキュリティラボがOpenClawの複数の重大な脆弱性を発見し、迅速な修正を協力
アリAIセキュリティラボがオープンソースAIフレームワークOpenClawを監査し、33の脆弱性を発見。最新版で8件(深刻1、高4、中3)を修正済み。アリグループは引き続きセキュリティリスクを注視し、AIエージェントの安全利用を支援。....
Mar 30, 2026
188.3k
ラクガメのセキュリティ問題に関するOpenAIのAIセキュリティスタートアップ企業Promptfooの買収
OpenAIがAIセキュリティ強化のため、2024年設立のスタートアップPromptfooを買収。同社はAI評価・安全に特化し、23名体制で35万開発者を擁し、評価額は8600万ドル。OpenAIのエージェントセキュリティ向上に貢献。....
Mar 11, 2026
174.2k
OpenAI、公式にPromptfooを吸収し、最後の欠けていた部分を補完する方針
OpenAIがPromptfooを買収し、AI開発の早期段階で自動化ツールを用いて誤りや悪意ある誘導を検出・防止し、AI技術の信頼性と安全性を強化します。....
Mar 10, 2026
244.5k
