近日,OpenAI 再次推出了一個令人興奮的新工具 ——“Operator”。這個新推出的 AI 智能體專爲瀏覽器任務設計,用戶只需簡單的指令,便能完成一系列繁瑣的在線操作。根據 OpenAI 於1月23日發佈的博文,現階段 “Operator” 僅向美國的 Pro 版訂閱用戶開放,但未來將逐步擴展至 Plus、Team 和 Enterprise 用戶。

“Operator” 的核心在於其強大的 Computer-Using Agent(CUA)模型,這一模型結合了 GPT-4的視覺處理能力以及通過強化學習獲得的高級推理能力,使其能夠輕鬆處理圖形用戶界面(GUI)。這意味着,用戶不再需要面對複雜的表單填寫、雜貨訂購或是創建表情包等重複性工作,AI 助手會在後臺悄然完成這些任務。
用戶可以通過訪問 operator.chatgpt.com,享受到這一創新功能。得益於其先進的技術,“Operator” 不僅能夠 “看到” 瀏覽器內容,還能通過鼠標和鍵盤進行全面交互,真正實現了無縫操作。用戶只需提供必要的指示,AI 便會通過屏幕截圖等方式 “理解” 需要完成的任務,並迅速採取行動,簡化了以往繁瑣的操作流程。
在未來,OpenAI 計劃將這一功能進一步整合到 ChatGPT 中,屆時更多用戶將能夠享受到這種便捷的瀏覽器任務自動化體驗。對於繁忙的現代人來說,這無疑是一個極大的便利,讓他們能更高效地處理日常生活中的網絡事務。
無論是在工作還是日常生活中,“Operator” 都有潛力成爲人們的得力助手,藉助這一智能工具,用戶能夠將更多精力集中於更具創意和戰略性的工作上,而將繁雜的重複任務交給 AI 去完成。
