近日,OpenAI 的全球事務副總裁安娜・馬坎朱(Anna Makanju)在聯合國 “未來峯會” 上發表了一番關於人工智能偏見的看法。
她提到,像 OpenAI 的 o1這樣的 “推理” 模型,能夠顯著減少 AI 系統中的偏見。那麼,o1是如何做到這一點的呢?馬坎朱解釋說,這些模型可以自我識別回答中的偏見,並更加遵循不產生 “有害” 回答的規則。

她表示,o1模型在處理問題時,會花費更多時間來評估自己的回答,能夠自我檢查:“它能夠說,‘這是我解決這個問題的方式’,然後再審視自己的回答,看看‘哦,這裏可能存在推理上的缺陷’。” 她甚至強調,1在分析自身偏見方面做得 “幾乎完美”,並且隨着技術進步,它的表現會越來越好。
不過,這種 “幾乎完美” 的說法似乎有些誇張。OpenAI 內部測試發現,相較於 “非推理” 模型,包括其自家的 GPT-4o,o1在一些偏見測試中表現得並不理想。在關於種族、性別和年齡的問題上,o1在某情況下表現得甚至不如 GPT-4o。儘管在隱性歧視方面,o1的表現更好,但在顯性歧視上,它卻在年齡和種族問題上顯得更爲突出。
更有意思的是,o1的經濟版 o1-mini 的表現更糟糕。測試顯示,o1-mini 在性別、種族和年齡上顯性歧視的概率高於 GPT-4o,同時在年齡問題上的隱性歧視也更爲明顯。
除此之外,當前的推理模型還有許多侷限性。OpenAI 也承認,o1在某些任務上帶來的好處微乎其微。它的反應速度較慢,有些問題需要超過10秒的時間來回答。而且,o1的成本也不容小覷,運行成本是 GPT-4o 的3到4倍。
如果馬坎朱所說的推理模型確實是實現公平 AI 的最佳途徑,那麼它們在偏見以外的其他方面也需要改善,才能成爲一個可行的替代方案。如果不能,只有那些財力雄厚、願意承受各種延遲和性能問題的客戶才能真正受益。
劃重點:
🌟 OpenAI 的 o1模型被稱爲能顯著減少 AI 偏見,但測試結果顯示其表現不如預期。
💡 o1在隱性歧視方面表現優於 GPT-4o,但在顯性歧視上卻更糟糕。
💰 推理模型 o1成本高,運行緩慢,未來仍需在多個方面改進。
