OpenAI 推出了全新的模型系列 OpenAI o1,這個新模型在推理能力上表現得更加出色,相較於之前的模型,它的表現令人期待。
OpenAI o1:更強的推理能力
這是一系列全新的推理模型,旨在幫助解決複雜問題。這些模型經過特別訓練,可以在作出迴應之前,花更多時間進行思考,能夠在科學、編碼和數學等領域解決比以往更具挑戰性的問題,OpenAI o1將先在 ChatGPT 和 API 上推出。
新模型是怎麼運作的呢?官方介紹,它們經過專門的訓練,學習如何像人類一樣思考問題,嘗試不同的解決策略,並及時識別錯誤。
研究人員在測試中發現,下一代模型的表現與博士生在物理、化學和生物學等高難度任務上的表現相當,尤其在數學和編碼領域更是表現出色。例如,在國際數學奧林匹克的資格考試中,傳統模型 GPT-4o 只正確解決了13% 的問題,而新的推理模型卻達到了83%。在編碼能力方面,它們在 Codeforces 競賽中也取得了第 89 百分位好成績。
OpenAI o1 解決了一個複雜的邏輯難題:
OpenAI o1 根據提示對視頻遊戲進行編碼:
OpenAI o1 翻譯一個損壞的句子:
不過,值得注意的是,作爲早期模型,o1-preview 還缺乏一些讓 ChatGPT 實用的功能,比如網絡瀏覽和文件上傳等。但在處理複雜推理任務時,這確實是一個巨大的進步。爲了配合新模型的能力,研究人員還加強了安全措施,確保它們遵循安全和對齊準則。
這些增強的推理能力特別適合那些在科學、編碼、數學等領域解決複雜問題的用戶,比如醫療研究人員、物理學家和開發者等。
OpenAI o1-mini
OpenAI還推出了一個更小的模型 ——OpenAI o1-mini,它在代碼生成和調試方面表現優秀,且成本更低,適合需要推理但不需要廣泛知識的應用。
作爲較小的模型,o1-mini 比 o1-preview 便宜80%,使其成爲一個功能強大、經濟高效的模型,適用於需要推理但不需要廣泛世界知識的應用程序。
如何使用OpenAI o1
從今天開始,ChatGPT Plus 和 Team 用戶可以在模型選擇中找到 o1-preview 和 o1-mini 兩個選項。
接下來,ChatGPT Enterprise 和 Edu 用戶也將獲得這兩個模型的訪問權限。而對於開發者來說,符合 API 使用條件的用戶已經可以開始使用這兩個模型進行原型開發了。
未來,官方將不斷更新這些推理模型,添加更多實用功能,包括瀏覽和文件上傳等,確保能爲用戶提供更好的體驗。
不過,要想充分使用這個新模型,用戶需要調整他們的提示方式,因爲 OpenAI o1 的工作方式和 GPT-4乃至 GPT-4o 有很大的不同。
根據 OpenAI 的 API 文檔,OpenAI o1 模型更喜歡簡單直接的提示。
提示工程設計,簡化模型引導
也就是說,用戶不需要像以往那樣給出複雜的指導或長篇的上下文。以前的模型需要更多的引導,用戶常常利用更長的上下文窗口來幫助模型理解任務,但OpenAI o1 已經具備了更強的內部推理能力,因此不再需要這些冗長的說明。
OpenAI 還提醒用戶在使用 o1模型時,需要注意以下幾點:
- 提示要保持簡單、直接,不要過多指導,因爲這個模型能夠很好地理解指令。
- 避免使用 “思路鏈” 提示,因爲 o1模型本身已經能夠進行內部推理。
- 使用分隔符,比如三重引號、XML 標籤和章節標題,這樣模型可以更清楚地知道自己正在解析哪個部分。
- 限制額外的上下文信息,特別是在進行增強檢索生成(RAG)任務時,因爲添加過多的背景資料可能會使模型的回答變得複雜。
這與 OpenAI 之前對用戶的建議截然不同。以前,OpenAI 建議用戶要非常具體,包括詳細信息並逐步指導模型,但現在的OpenAI o1 則更能自主思考,找到解決問題的方法。
在 Penn 大學沃頓商學院教授 Ethan Mollick 的博客中,他提到作爲早期用戶,他發現OpenAI o1 在需要規劃的任務中表現得更爲出色,能夠自主得出解決方案。
當然,提示工程也變得越來越重要,這不僅成爲一種重要技能,還是一個新興的職業類別。爲此,其他 AI 開發者也推出了便於用戶設計提示的工具,比如谷歌推出的 Prompt Poet,它通過集成外部數據源,使得響應更加相關。
由於OpenAI o1 的不同,用戶仍在弄清楚如何使用它。然而,一些社交媒體用戶預測,人們將不得不改變他們提示 ChatGPT 的方式。
儘管 OpenAI o1還很新,大家仍在摸索如何使用它,但社交媒體上的一些用戶已經預測,大家需要重新思考與 ChatGPT 的互動方式。
官方博客:https://openai.com/index/introducing-openai-o1-preview/
產品入口訪問:https://top.aibase.com/tool/openai-o1
劃重點:
- 🤖 OpenAI o1模型需要簡單、直接的提示,而非複雜的指導。
- 🧠 避免使用思路鏈提示,因爲 o1模型已經具備內部推理能力。
- 📑 使用分隔符來明確模型解析的部分,並限制額外上下文以避免複雜回答。