OpenAI 新模型 o1 聲稱能 “完美” 糾正偏見，但數據並不完全支持

近日，OpenAI 的全球事務副總裁安娜・馬坎朱（Anna Makanju）在聯合國 “未來峯會” 上發表了一番關於人工智能偏見的看法。

她提到，像 OpenAI 的 o1這樣的 “推理” 模型，能夠顯著減少 AI 系統中的偏見。那麼，o1是如何做到這一點的呢?馬坎朱解釋說，這些模型可以自我識別回答中的偏見，並更加遵循不產生 “有害” 回答的規則。

OpenAI，人工智能，AI

她表示，o1模型在處理問題時，會花費更多時間來評估自己的回答，能夠自我檢查:“它能夠說，‘這是我解決這個問題的方式’，然後再審視自己的回答，看看‘哦，這裏可能存在推理上的缺陷’。” 她甚至強調，1在分析自身偏見方面做得 “幾乎完美”，並且隨着技術進步，它的表現會越來越好。

不過，這種 “幾乎完美” 的說法似乎有些誇張。OpenAI 內部測試發現，相較於 “非推理” 模型，包括其自家的 GPT-4o，o1在一些偏見測試中表現得並不理想。在關於種族、性別和年齡的問題上，o1在某情況下表現得甚至不如 GPT-4o。儘管在隱性歧視方面，o1的表現更好，但在顯性歧視上，它卻在年齡和種族問題上顯得更爲突出。

更有意思的是，o1的經濟版 o1-mini 的表現更糟糕。測試顯示，o1-mini 在性別、種族和年齡上顯性歧視的概率高於 GPT-4o，同時在年齡問題上的隱性歧視也更爲明顯。

除此之外，當前的推理模型還有許多侷限性。OpenAI 也承認，o1在某些任務上帶來的好處微乎其微。它的反應速度較慢，有些問題需要超過10秒的時間來回答。而且，o1的成本也不容小覷，運行成本是 GPT-4o 的3到4倍。

如果馬坎朱所說的推理模型確實是實現公平 AI 的最佳途徑，那麼它們在偏見以外的其他方面也需要改善，才能成爲一個可行的替代方案。如果不能，只有那些財力雄厚、願意承受各種延遲和性能問題的客戶才能真正受益。

劃重點:
🌟 OpenAI 的 o1模型被稱爲能顯著減少 AI 偏見，但測試結果顯示其表現不如預期。
💡 o1在隱性歧視方面表現優於 GPT-4o，但在顯性歧視上卻更糟糕。
💰 推理模型 o1成本高，運行緩慢，未來仍需在多個方面改進。

OpenAI 新模型 o1 聲稱能 “完美” 糾正偏見，但數據並不完全支持

相關推薦

AI編程聖誕大戰打響！OpenAI推節日版Codex，三巨頭齊發限時福利搶奪開發者

ChatGPT界面大升級！OpenAI上線“富文本編輯塊”，寫郵件、寫博客無需再複製到Word

對話框變身編輯器:OpenAI 低調上線“格式化模塊”，ChatGPT 也能像 Word 一樣排版

OpenAI 與博通達成 10GW 定製芯片合作，2026 年推出新一代 AI 基礎設施

告別對話框!OpenAI 上線“格式化塊”，讓 ChatGPT 秒變在線編輯器