相关推荐
xAI官宣200亿美元E轮融资!Grok月活达6亿,却因生成儿童深度伪造色情内容遭多国调查
xAI完成200亿美元E轮融资,创2026年全球AI领域融资新高。本轮投资方包括Valor Equity Partners、富达及战略投资者英伟达,资金将用于扩建数据中心和升级Grok大模型。但与此同时,其AI聊天机器人Grok被曝存在严重安全漏洞。
2026年1月7号 11:07
139.6k
谷歌 DeepMind 发布 Gemma Scope 2:为 Gemma 3 模型提供全栈可解释性工具
谷歌DeepMind推出Gemma Scope2,这是一个开放的可解释性工具套件,旨在深入分析Gemma3语言模型从2.7亿到270亿参数的各层次信息处理。该工具帮助AI安全与对齐团队追踪模型内部特征,以应对“越狱”、幻觉或不当行为等问题。
2025年12月23号 15:18
166.7k
红帽收购 AI 公司 Chatterbox Labs 强化企业级 AI 安全能力
红帽收购AI公司Chatterbox Labs,以强化企业级AI布局。该公司专注AI模型测试与生成式AI安全,其AIMI平台可量化AI风险并管理模型行为。这是红帽继去年收购Neural Magic后在AI领域的又一重要投资。
2025年12月17号 8:55
146.0k
仅需250份文件!AI模型也能被 “洗脑” 的惊人发现
最新研究显示,ChatGPT等大语言模型易受数据中毒攻击,仅需约250份污染文件即可植入后门,改变模型回应,暴露AI安全脆弱性,引发对现有防护措施的反思。
2025年10月20号 9:08
138.7k
Anthropic 突破性发现:仅250份中毒文件即可攻破大型 AI 模型
研究表明,仅需250份投毒文件即可在大型语言模型中植入后门,且攻击效果与模型大小无关。测试涵盖6亿至130亿参数模型,发现即使使用更干净数据训练的大模型,所需中毒文档数量不变,挑战了传统认知。
2025年10月11号 9:45
154.5k
