AI也怕 “信息轰炸”？新研究揭示聊天机器人可被诱导违反安全规则

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年7月9号 16:47

随着人工智能（AI）技术的迅猛发展，越来越多的公司将其应用于日常生活的各个方面。然而，这项技术的安全性与伦理问题也随之引发了广泛关注。最近，来自英特尔、博伊西州立大学和伊利诺伊大学的研究人员发现，聊天机器人可能会在面对大量信息时被误导，进而违反其安全规则。

这项研究提出了一种名为 “信息过载” 的新型攻击方法，研究人员开发了一个名为 “InfoFlood” 的自动化系统，利用这一方法来诱使大型语言模型（LLM）如 ChatGPT 和 Gemini 说出不该说的话。根据研究，传统的防护措施主要依赖于识别特定的关键词，但在面对信息轰炸时，模型可能会出现混乱，从而绕过这些防护。

机器人比赛答题数学

图源备注：图片由AI生成，图片授权服务商Midjourney

研究团队解释说，当聊天机器人收到过量的信息时，它们可能会误解用户的意图，导致错误的回答。这种方法通过创建一个标准化的提示模板，向 AI 模型施加更多信息，以达到干扰和混淆的效果。比如，当模型拒绝回答某个问题时，InfoFlood 会在提示中添加虚假的引用或不相关的伦理声明，从而使模型陷入困境。

更令人担忧的是，这项技术的发现揭示了即使在设有安全过滤器的情况下，恶意用户仍然可以通过信息过载的方式来操控模型，植入有害内容。研究人员计划将这一发现的报告发送给拥有大型 AI 模型的公司，提醒他们加强安全措施。

随着技术的不断进步，如何在保护用户的同时合理使用 AI，仍然是一个亟待解决的难题。研究者们希望通过这项研究，引发更多关于 AI 安全和伦理的讨论，并促使技术公司采取更有效的防护措施。

OpenAI CEO 奥尔特曼期待与扎克伯格会晤，人才争夺战愈演愈烈

Meta CEO扎克伯格以高达1亿美元薪酬挖角OpenAI顶尖工程师，引发科技界人才争夺战。OpenAI CEO奥尔特曼表示将通过使命感、团队才华和一流实验室留住人才，并对公司前景保持信心。两人即将在太阳谷峰会首次会面，奥尔特曼还强调AI基础设施建设需要政企合作。这场人才争夺或将重塑科技行业格局。

Vidu Q1 参考生视频全球上线最多支持7个主体输入

AI视频领域迎来重大革新——生数科技推出的Vidu Q1视频模型正式上线参考生功能，以“从想象到视频素材生成只需一步”的颠覆性体验，重新定义了内容创作的技术边界与生产效率。传统视频制作流程中，创作者需经历脚本撰写、角色设计、分镜绘制、实景拍摄、后期剪辑等复杂环节，一部短片的诞生往往耗时数周甚至数月。而Vidu Q1参考生功能的推出，彻底打破了这一固有模式。用户仅需上传人物、道具、场景等参考图，系统即可在几分钟内自动生成融合多元素的视频素材，实现“零分镜生成”。例如，输入两张牛仔人物图、两个场景图和两把手枪图，便能直接生成一段西部对决的影视级画面，远景、特写、情节推进一气呵成，无需任何人工分镜设计。

Lovable7个月年收入8000万美元团队半数竟是AI原生员工

AI原生员工正在重塑工作模式。初创公司Lovable仅用35人团队7个月实现8000万美元年收入，其成功源于AI驱动的敏捷工作方式：想法立即用AI实现，省去传统繁琐流程；用自研AI工具快速开发营销页面、管理项目；年轻员工不受传统束缚，享有高度自主权。作者预测未来将涌现更多AI原生员工，传统管理层面临挑战，协调型岗位可能被裁减，AI员工将成为创新核心力量。

4000万考生和家长用AI报志愿，夸克刷新高考服务纪录

2025年高考志愿填报服务收官，夸克平台数据显示其AI服务创下多项纪录：累计服务超4000万用户，生成1200万份志愿报告，解答3.3亿个问题。今年推出的三大核心功能依托自研高考大模型，实现从咨询到决策的全流程智能化辅助。值得注意的是，考生提问呈现深度个性化趋势，复杂问题占比翻倍。平台还通过"暖芒计划"将AI服务延伸至乡村地区，五年累计服务用户达1.6亿，展现了AI技术在教育公平领域的应用价值。

阿里HumanOmniV2震撼发布：多模态AI新王者，准确率飙升至69.33%

阿里巴巴推出多模态大模型HumanOmniV2，具备全局上下文理解和多模态推理能力。该模型通过强制性上下文总结机制解决传统模型的"捷径问题"，在Daily-Omni、WorldSense等测试中表现优异。由Tongyi Lab研发，支持多语言输入，适用于智能客服、内容创作等场景。阿里近期密集发布AI产品，与华为、百度等企业展开竞争，HumanOmniV2的开源策略或将推动行业标准革新。