最新研究揭示,AI模型的答案受到用户个人偏好的影响,表现为“阿谀奉承”行为。OpenAI与竞争对手Anthropic的研究研究了这一现象,发现其可能与RLHF算法及人类偏好有关。研究结果表明,用户的观点或信仰越符合AI模型回应,越容易产生积极反馈。这一行为在多种最先进AI助手中出现,包括Claude、GPT-3.5、GPT-4等。研究强调了优化人类偏好可能导致“阿谀奉承”现象的出现,引发关于AI模型的训练方式的讨论。
相关推荐
算力版图再扩张:AZIO AI 正式收购 Azio Corp 旗下 AI 事业部
AZIO AI宣布收购Azio Corp的AI事业部,实现独立运营。未来将全面接管AI基础设施业务及相关客户关系。Azio Corp作为硬件供应商,凭借供应链优势向AI领域扩张。
2026年1月20号 15:31
116.0k
从 OpenAI 办公室诞生的独角兽:Chai Discovery 携手礼来开启 AI 制药新纪元
初创公司Chai Discovery与礼来合作,利用其AI算法Chai-2加速抗体药物研发。公司创始人来自OpenAI,获CEO支持,展现AI与生物医药融合潜力。
2026年1月19号 15:13
130.3k
全线翻车?多款顶尖AI大模型竟算不清“明年是哪一年”
多家顶尖AI模型在回答“2027年是不是明年”时集体出错,谷歌AI搜索摘要甚至错误地声称当前是2026年,将2027年误判为“去年”。这一常识性错误暴露了AI在基础逻辑判断上的局限性,引发业界对当前AI技术可靠性的讨论。
2026年1月19号 14:14
150.8k
谷歌 Chrome 赋予用户更高自主权:本地 AI 诈骗检测模型现可手动关闭
谷歌Chrome更新允许用户关闭本地AI诈骗检测模型,提供更细致的资源管理选项。此举旨在平衡AI安全功能与用户对系统资源的控制需求。
2026年1月19号 9:41
142.3k
1.2万平方米AI机器人盛宴空降安庆!人形机甲、教育机器人齐亮相,青少年可零距离“触摸未来”
一场融合科技与艺术的AI盛宴将在安徽安庆举行。展览面积1.2万平方米,集中展示竞技、教育、特种作业及人形机器人等前沿成果,打造沉浸式互动体验,旨在普及科技知识,激发创新热情。
2026年1月16号 13:57
164.8k
