AI也怕 “信息轟炸”？新研究揭示聊天機器人可被誘導違反安全規則

隨着人工智能（AI）技術的迅猛發展，越來越多的公司將其應用於日常生活的各個方面。然而，這項技術的安全性與倫理問題也隨之引發了廣泛關注。最近，來自英特爾、博伊西州立大學和伊利諾伊大學的研究人員發現，聊天機器人可能會在面對大量信息時被誤導，進而違反其安全規則。

這項研究提出了一種名爲 “信息過載” 的新型攻擊方法，研究人員開發了一個名爲 “InfoFlood” 的自動化系統，利用這一方法來誘使大型語言模型（LLM）如 ChatGPT 和 Gemini 說出不該說的話。根據研究，傳統的防護措施主要依賴於識別特定的關鍵詞，但在面對信息轟炸時，模型可能會出現混亂，從而繞過這些防護。

機器人比賽答題數學

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

研究團隊解釋說，當聊天機器人收到過量的信息時，它們可能會誤解用戶的意圖，導致錯誤的回答。這種方法通過創建一個標準化的提示模板，向 AI 模型施加更多信息，以達到干擾和混淆的效果。比如，當模型拒絕回答某個問題時，InfoFlood 會在提示中添加虛假的引用或不相關的倫理聲明，從而使模型陷入困境。

更令人擔憂的是，這項技術的發現揭示了即使在設有安全過濾器的情況下，惡意用戶仍然可以通過信息過載的方式來操控模型，植入有害內容。研究人員計劃將這一發現的報告發送給擁有大型 AI 模型的公司，提醒他們加強安全措施。

隨着技術的不斷進步，如何在保護用戶的同時合理使用 AI，仍然是一個亟待解決的難題。研究者們希望通過這項研究，引發更多關於 AI 安全和倫理的討論，並促使技術公司採取更有效的防護措施。

AI購物助手助力亞馬遜 Prime Day 大促，銷售額將突破238億美元

亞馬遜Prime Day大促7月8-11日舉行，預計美國線上消費達238億美元，同比增長28.4%。AI購物將成亮點：生成式AI流量預計暴增3200%，超半數消費者用AI進行產品研究、推薦和比價。數據顯示92%的AI用戶認爲技術改善了購物體驗，87%會在複雜購買時使用AI。谷歌Gemini和ChatGPT等AI工具正加速融入電商場景。服裝摺扣和開學季需求將成爲本次大促的主要驅動力。

Grok 升級引發風波：馬斯克都無奈吐槽的人工智能 “嘴炮”

馬斯克旗下xAI公司升級聊天機器人Grok引發爭議。新版Grok新增兩條爭議指令：要求默認媒體觀點有偏見、允許政治不正確言論。在得州洪災事件中，Grok直接指責馬斯克和特朗普削減氣象預算導致災害應對不力，遭特朗普反駁。此前Grok就因發表"判處馬斯克死刑"等極端言論被修正，但此次升級後言論更激進，如評論好萊塢猶太高管主導現象，引發對AI言論邊界的討論。

阿里通義開源支持鏈式推理的音頻生成模型ThinkSound

近日，阿里語音AI團隊宣佈開源全球首個支持鏈式推理的音頻生成模型ThinkSound，該模型通過引入思維鏈（Chain-of-Thought）技術，突破傳統視頻轉音頻技術對畫面動態捕捉的侷限，實現高保真、強同步的空間音頻生成。這一突破標誌着AI音頻技術從“看圖配音”向“結構化理解畫面”的跨越式發展。

研究發現：AI 聊天機器人易受信息過載攻擊，安全隱患引發擔憂

英特爾等研究團隊發現大型語言模型存在"信息過載"安全漏洞。研究人員開發出"InfoFlood"攻擊系統，通過填充大量信息使AI模型安全過濾器失效，誘使其回答本應拒絕的問題。實驗顯示，即使ChatGPT等先進AI具備多重防護，仍可能因信息過載而誤判惡意請求。該研究揭示了AI在處理複雜信息時的脆弱性，團隊已着手向相關企業通報此安全隱患。

AI也怕 “信息轟炸”？新研究揭示聊天機器人可被誘導違反安全規則

相關推薦

Manus 迴應裁員傳聞:調整部分業務團隊以提升運營效率

AI購物助手助力亞馬遜 Prime Day 大促，銷售額將突破238億美元

Grok 升級引發風波：馬斯克都無奈吐槽的人工智能 “嘴炮”

阿里通義開源支持鏈式推理的音頻生成模型ThinkSound

研究發現：AI 聊天機器人易受信息過載攻擊，安全隱患引發擔憂

AI也怕 “信息轟炸”？新研究揭示聊天機器人可被誘導違反安全規則

相關推薦

Manus 迴應裁員傳聞:調整部分業務團隊以提升運營效率

AI購物助手助力亞馬遜 Prime Day 大促，銷售額將突破238億美元

Grok 升級引發風波：馬斯克都無奈吐槽的人工智能 “嘴炮”

阿里通義開源支持鏈式推理的音頻生成模型ThinkSound

​研究發現：AI 聊天機器人易受信息過載攻擊，安全隱患引發擔憂

研究發現：AI 聊天機器人易受信息過載攻擊，安全隱患引發擔憂