近日,Anthropic 公司发布了一种新的方法,用于评估其聊天机器人 Claude 在政治问题上的响应是否公正中立。该公司表示,Claude 在回答政治相关问题时应避免没有证据的政治主张,旨在防止其被视为偏向保守或自由派。
Claude 的表现受系统提示和奖励机制的影响,特别是奖励那些被认为是中立的回答。这些中立回答中可能包含有关尊重 “传统价值观和制度重要性” 的内容,显示出该公司试图让 Claude 更符合美国当前的政治需求。

根据报告,Gemini2.5Pro 被评为最中立的 AI,得分高达97%,而 Claude Opus4.1则以95% 的得分紧随其后。其他模型如 Sonnet4.5、GPT-5、Grok4和 Llama4的评分也相对较高,但仍低于 Claude。尽管 Anthropic 在其博客中未明确提到,但这一测试方法的推出很可能与特朗普政府的政策有关,该政策要求聊天机器人不得展现 “觉醒”(woke)现象。同时,OpenAI 也在将其 GPT-5模型调整至相似的方向,以满足美国政府的要求。
值得一提的是,Anthropic 将其测试方法以开源的形式发布在 GitHub 上,方便其他开发者和研究人员使用和评估。
划重点:
🌐 Anthropic 推出新方法,评估 Claude 在政治问题上的中立性。
🤖 Claude 避免没有证据的政治主张,旨在消除偏见标签。
📈 该测试方法开源发布,促进 AI 开发者间的交流与合作。
