Patronus AI发布SimpleSafetyTests测试套件,发现ChatGPT等AI系统存在关键安全漏洞。测试揭示了11个LLMs中的严重弱点,强调安全提示可减少不安全响应。结果表明在处理真实世界应用之前,LLMs需要严格而定制的安全解决方案。
相关推荐
马斯克出庭狠批OpenAI:ChatGPT或导致用户自杀,xAI更注重安全!
马斯克在法庭上指责OpenAI存在安全漏洞,称其xAI的Grok更安全,并暗示ChatGPT与自杀事件有关。庭审围绕2023年3月一封呼吁暂停AI开发的公开信展开。
2026年2月28号 9:18
138.5k
马斯克出庭猛烈抨击 OpenAI:称“没人因为 Grok 自杀”
马斯克在庭审证词中批评OpenAI忽视AI安全,称其产品曾导致自杀事件,并强调自家xAI更重视安全性。
2026年2月28号 8:54
82.4k
营收三年翻三倍:AI 社交平台 CHAI 估值突破 14 亿美元,加码自杀干预安全系统
CHAI作为生成式AI社交初创公司,过去三年实现每年3倍增长,ARR达6800万美元,估值超14亿美元。在用户规模快速扩张的同时,公司升级安全框架,重点加强自杀预防和自残干预措施,强调AI安全责任。
2026年2月24号 13:46
128.3k
OpenAI 删除 AI 安全造福人类核心承诺
OpenAI在最新税务文件中删除了“AI安全造福人类、不受营利需求约束”的核心使命承诺,与其创立时研发非营利性通用人工智能的初衷相悖,引发公众对其价值观转向商业化的担忧。
2026年2月15号 13:52
199.6k
封堵提示注入漏洞!OpenAI 为 ChatGPT 新增两大高级安全防护措施
OpenAI为ChatGPT新增两项高级安全防护措施,以应对提示注入攻击风险。新措施基于现有安全体系,包括沙箱机制和URL数据外泄防护。首个措施是面向高安全需求用户的可选锁定模式,旨在防止第三方诱导AI执行恶意指令或泄露敏感信息。
2026年2月14号 15:43
173.4k
