相關推薦
xAI官宣200億美元E輪融資!Grok月活達6億,卻因生成兒童深度僞造色情內容遭多國調查
xAI完成200億美元E輪融資,創2026年全球AI領域融資新高。本輪投資方包括Valor Equity Partners、富達及戰略投資者英偉達,資金將用於擴建數據中心和升級Grok大模型。但與此同時,其AI聊天機器人Grok被曝存在嚴重安全漏洞。
Jan 7, 2026
154.5k
谷歌 DeepMind 發佈 Gemma Scope 2:爲 Gemma 3 模型提供全棧可解釋性工具
谷歌DeepMind推出Gemma Scope2,這是一個開放的可解釋性工具套件,旨在深入分析Gemma3語言模型從2.7億到270億參數的各層次信息處理。該工具幫助AI安全與對齊團隊追蹤模型內部特徵,以應對“越獄”、幻覺或不當行爲等問題。
Dec 23, 2025
166.7k
紅帽收購 AI 公司 Chatterbox Labs 強化企業級 AI 安全能力
紅帽收購AI公司Chatterbox Labs,以強化企業級AI佈局。該公司專注AI模型測試與生成式AI安全,其AIMI平臺可量化AI風險並管理模型行爲。這是紅帽繼去年收購Neural Magic後在AI領域的又一重要投資。
Dec 17, 2025
128.3k
僅需250份文件!AI模型也能被 “洗腦” 的驚人發現
最新研究顯示,ChatGPT等大語言模型易受數據中毒攻擊,僅需約250份污染文件即可植入後門,改變模型迴應,暴露AI安全脆弱性,引發對現有防護措施的反思。
Oct 20, 2025
149.8k
Anthropic 突破性發現:僅250份中毒文件即可攻破大型 AI 模型
研究表明,僅需250份投毒文件即可在大型語言模型中植入後門,且攻擊效果與模型大小無關。測試涵蓋6億至130億參數模型,發現即使使用更乾淨數據訓練的大模型,所需中毒文檔數量不變,挑戰了傳統認知。
Oct 11, 2025
138.7k
