IBM 研究：AI 聊天機器人很容易被欺騙生成惡意代碼

IBM 的研究表明，通過欺騙大型語言模型如 GPT-4，可以輕鬆生成惡意代碼或提供虛假安全建議。研究人員發現，只需要英語基礎知識和對模型訓練數據的一些背景知識就能輕鬆欺騙 AI 聊天機器人。不同的 AI 模型對欺騙的敏感性有所差異，其中 GPT-3.5 和 GPT-4 更容易被欺騙。這些新發現的漏洞對於大型語言模型的威脅程度是中等的，但如果黑客將這些模型釋放到互聯網上，聊天機器人可能被用來提供危險的安全建議或收集用戶的個人信息。

黑客利用 “損壞” pickle 文件在 HuggingFace 上傳惡意 AI 模型

近日，網絡安全研究人員發現，在知名機器學習平臺 HuggingFace 上，有兩個惡意的機器學習模型悄然上傳。這些模型使用了一種新奇的技術，通過 “損壞” 的 pickle 文件成功規避了安全檢測，令人擔憂。ReversingLabs 的研究員卡洛・贊基（Karlo Zanki）指出，從這些 PyTorch 格式的存檔中提取的 pickle 文件開頭，暗示了其中包含惡意的 Python 代碼。這些惡意代碼主要是反向 shell，能夠連接到硬編碼的 IP 地址，實現黑客的遠程控制。這種利用 pickle 文件的攻擊方法被稱爲 nullifAI，目的是繞過現有的安全

Hugging Face AI 平臺曝出 100 個惡意代碼執行模型

["研究人員在 Hugging Face AI 平臺上發現大約 100 個惡意機器學習模型，可能讓攻擊者注入惡意代碼到用戶機器上。","惡意 AI 模型利用 PyTorch 等方法執行惡意代碼，加劇安全風險。","AI 開發者應使用新工具如 Huntr 提高 AI 模型安全性。","發現的惡意模型突顯惡意 AI 模型對用戶環境帶來的風險，需要持續警惕和加強安全性。"]

小紅書內測 AI 聊天機器人 “Davinic 達芬奇”

["小紅書內測 AI 聊天機器人 “Davinic 達芬奇”","小紅書主 APP 內測 AI 功能，名爲 “Davinic 達芬奇”","AI 功能爲用戶提供智能問答等聊天功能","“Davinic” 涵蓋旅遊攻略、美食攻略、地理和文化常識、生活技巧等多個方面","利用機器學習和數據分析技術個性化推薦內容和交友對象"]

抖音 AI 情緒關懷機器人 “抖音心晴” 上線測試

["抖音計劃推出多個 AI 聊天機器人，首個測試機器人 “抖音心晴” 上線","“抖音心晴” 是一款情緒關懷機器人，通過智能模型與用戶進行互動","機器人位於抖音 APP 消息界面，標註爲 “AI 虛擬角色”","用戶可與 “抖音心晴” 互動，傾訴情緒、獲得安慰和解答","未來可能添加語音和視頻互動功能，抖音 APP 計劃上線多個 AI 虛擬角色"]

IBM 研究：AI 聊天機器人很容易被欺騙生成惡意代碼

相關推薦

黑客利用 “損壞” pickle 文件在 HuggingFace 上傳惡意 AI 模型

Hugging Face AI 平臺曝出 100 個惡意代碼執行模型

小紅書內測 AI 聊天機器人 “Davinic 達芬奇”

抖音 AI 情緒關懷機器人 “抖音心晴” 上線測試

研究發現ChatGPT存在惡意代碼操縱風險