正文

Patronus AI发现领先AI系统存在“令人担忧”的安全漏洞

发布于AI新闻资讯

发布时间 :2023年12月20号 15:09

阅读 :1分钟

Patronus AI发布SimpleSafetyTests测试套件，发现ChatGPT等AI系统存在关键安全漏洞。测试揭示了11个LLMs中的严重弱点，强调安全提示可减少不安全响应。结果表明在处理真实世界应用之前，LLMs需要严格而定制的安全解决方案。

Anthropic Mythos AI 模型遭黑客入侵，安全性引发质疑

Anthropic公司开发的Claude Mythos AI模型因网络安全能力过强而未公开发布，但遭黑客在测试期间非法获取。该事件凸显AI安全挑战，使注重安全的Anthropic陷入困境。

蚂蚁AI安全实验室对开源智能体框架OpenClaw进行安全审计，发现33个漏洞。最新版本已修复其中8个，包括1个严重、4个高危和3个中危漏洞。蚂蚁集团将持续关注其安全风险，支持AI智能体安全应用。

AI安全先驱成立Anthropic Institute智库，专注研究强大AI带来的深层风险。智库预测未来两年AI将迎突破性进展，可能接近通用人工智能（AGI），因此将重点应对相关挑战。

OpenAI收购初创公司Promptfoo，强化AI安全布局。这家成立于2024年的公司专注于AI应用评测与安全，拥有23人团队和35万开发者用户，估值达8600万美元。收购将帮助OpenAI弥补智能体安全方面的不足，应对AI智能体快速发展带来的安全挑战。

OpenAI收购Promptfoo，强化AI安全防线。此举旨在通过自动化工具，在开发早期检测并防止大模型产生错误或被恶意引导，确保AI技术的可靠与安全。

智启未来，您的人工智能解决方案智库