近日,Anthropic 公司發佈了一種新的方法,用於評估其聊天機器人 Claude 在政治問題上的響應是否公正中立。該公司表示,Claude 在回答政治相關問題時應避免沒有證據的政治主張,旨在防止其被視爲偏向保守或自由派。
Claude 的表現受系統提示和獎勵機制的影響,特別是獎勵那些被認爲是中立的回答。這些中立回答中可能包含有關尊重 “傳統價值觀和制度重要性” 的內容,顯示出該公司試圖讓 Claude 更符合美國當前的政治需求。

根據報告,Gemini2.5Pro 被評爲最中立的 AI,得分高達97%,而 Claude Opus4.1則以95% 的得分緊隨其後。其他模型如 Sonnet4.5、GPT-5、Grok4和 Llama4的評分也相對較高,但仍低於 Claude。儘管 Anthropic 在其博客中未明確提到,但這一測試方法的推出很可能與特朗普政府的政策有關,該政策要求聊天機器人不得展現 “覺醒”(woke)現象。同時,OpenAI 也在將其 GPT-5模型調整至相似的方向,以滿足美國政府的要求。
值得一提的是,Anthropic 將其測試方法以開源的形式發佈在 GitHub 上,方便其他開發者和研究人員使用和評估。
劃重點:
🌐 Anthropic 推出新方法,評估 Claude 在政治問題上的中立性。
🤖 Claude 避免沒有證據的政治主張,旨在消除偏見標籤。
📈 該測試方法開源發佈,促進 AI 開發者間的交流與合作。
