OpenAI 宣佈推出其最新 AI 代理 “Operator”,這一工具旨在幫助用戶在網絡上執行各種任務。OpenAI 在其博客中表示,Operator 正在進行 “研究預覽”,初步面向美國的 ChatGPT Pro 訂閱用戶,月費爲200美元。

image.png

Operator 的設計理念是通過一種稱爲 “計算機使用代理” 的模型,結合了 GPT-4o 的視覺能力和強化學習的高級推理,能夠與圖形用戶界面(GUI)進行交互。OpenAI 解釋道,Operator 可以通過其內置的瀏覽器查看網頁,並通過鍵入、單擊和滾動等方式與頁面進行交互。這一技術的優勢在於,Operator 能夠在不需要定製 API 集成的情況下,在網絡上自主行動。

image.png

在使用過程中,Operator 不僅能夠利用推理能力進行 “自我糾正”,還會在遇到困難時將控制權交還給用戶。當網站請求敏感信息,例如登錄憑據時,Operator 會詢問用戶是否接管該操作。此外,Operator 在處理諸如發送電子郵件等事務時,也會要求用戶進行確認。OpenAI 強調,Operator 在設計上特別注重安全性,旨在拒絕有害請求並屏蔽不允許的內容。

OpenAI 還透露,Operator 正在與多個知名公司合作,如 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack 和 Uber 等,以確保其滿足現實世界的需求,並遵循已建立的行業規範。不過,OpenAI 也提醒用戶,目前該工具在處理複雜界面時可能會遇到困難,例如創建幻燈片或管理日曆。

OpenAI 計劃將 Operator 擴展至 Plus、Team 和 Enterprise 用戶,並將這些功能整合進 ChatGPT 中。這意味着更多用戶將有機會體驗到這一前沿技術所帶來的便利。

官方播客:https://openai.com/index/introducing-operator/

劃重點:

🌐 OpenAI 推出 “Operator” AI 智能體,幫助用戶在線執行任務,首批面向 ChatGPT Pro 用戶。

🖱️ Operator 可以通過瀏覽器與網頁交互,具備自我糾正和用戶控制的功能,確保安全性。

🤝 OpenAI 與多個知名公司合作,致力於滿足現實需求,同時計劃未來擴展至更多用戶。