人工智能領域領軍企業 OpenAI 近日重磅發佈了一份名爲“構建智能體實踐指南”("A practical guide to building agents")的實用性文檔。這份共34頁的指南旨在爲產品和工程團隊提供構建首個智能體系統的必要知識和最佳實踐,其內容凝結了 OpenAI 從衆多客戶實際部署案例中獲得的深刻洞察。

通過閱讀本指南,開發者將能夠理解智能體的核心概念,掌握何時以及如何設計、構建和安全部署智能體。

QQ_1744946969203.png

什麼是智能體?

指南首先對智能體進行了清晰的定義,強調其與傳統軟件在自動化工作流程方式上的根本區別。傳統軟件旨在簡化和自動化用戶發起的工作流程,而智能體則能夠高度自主地代表用戶完成整個工作流程。一個工作流程被定義爲實現用戶目標所需執行的一系列步驟,例如解決客戶服務問題、預訂餐廳、提交代碼變更或生成報告. 然而,僅僅集成大型語言模型(LLM)的應用程序,如果不能利用 LLM 來控制工作流程的執行,例如簡單的聊天機器人或情感分類器,則不能被稱爲智能體。真正的智能體具備核心特徵,使其能夠可靠且一致地代表用戶行動,這包括利用 LLM 管理工作流程的執行和做出決策,並在必要時主動糾正自身行爲,甚至在失敗時中止執行並將控制權交還給用戶。此外,智能體還能訪問各種工具與外部系統進行交互,動態選擇合適的工具,並在明確定義的安全護欄內運行.

何時應該構建智能體?

指南指出,構建智能體需要重新思考系統如何進行決策和處理複雜性。與傳統的確定性和基於規則的方法不同,智能體特別適用於那些傳統方法難以奏效的工作流程。指南通過支付欺詐分析的例子進行了生動的對比:傳統的規則引擎如同一個清單,根據預設的標準標記交易;而 LLM 智能體則更像一位經驗豐富的調查員,能夠評估上下文、考慮細微的模式,即使在沒有明確規則的情況下也能識別可疑活動。因此,在評估智能體的價值時,應優先考慮那些過去難以自動化的工作流程,尤其是在以下三種場景中:

  • 複雜的決策: 涉及細緻的判斷、異常情況或上下文相關的決策的工作流程,例如客戶服務中的退款審批。
  • 難以維護的規則: 由於龐大且複雜的規則集而變得難以維護的系統,使得更新成本高昂或容易出錯,例如執行供應商安全審查。
  • 嚴重依賴非結構化數據: 涉及解釋自然語言、從文檔中提取意義或以對話方式與用戶交互的場景,例如處理房屋保險索賠。

指南強調,在決定構建智能體之前,務必驗證用例是否明確符合這些標準,否則,確定性的解決方案可能就足夠了。

智能體設計基礎

指南詳細介紹了構建智能體的三個核心組成部分:

  • 模型(LLM): 驅動智能體的推理和決策。指南建議在原型階段使用性能最強的模型建立基準,然後嘗試使用較小的模型以優化成本和延遲。
  • 工具: 智能體可以用來執行操作的外部函數或 API。工具通過底層應用程序或系統的 API 擴展了智能體的能力。對於沒有 API 的遺留系統,智能體可以依賴計算機使用模型通過 Web 和應用程序 UI 直接交互。指南將工具大致分爲三類:數據檢索(例如查詢數據庫、讀取 PDF 文件或搜索網絡)、執行操作(例如發送電子郵件、更新 CRM 記錄)和 編排(智能體本身可以作爲其他智能體的工具)。
  • 指令: 定義智能體行爲的明確指南和安全護欄。高質量的指令對於智能體至關重要,能夠減少歧義並提高決策質量。指南提供了利用現有文檔、將任務分解爲更小的步驟、定義清晰的行動以及捕獲邊緣案例等最佳實踐。

指南還簡要介紹了編排的概念,即將基礎組件組合起來以有效地執行工作流程。編排模式主要分爲單智能體系統(單個智能體配備工具和指令在一個循環中執行工作流程)和多智能體系統(工作流程的執行分佈在多個協調的智能體之間)。多智能體系統又可以分爲管理模式(一箇中央“管理”智能體通過工具調用協調多個專業智能體)和去中心化模式(多個智能體作爲對等方運行,根據其專業領域相互移交任務).

安全護欄

指南特別強調了安全護欄對於管理數據隱私風險和聲譽風險的關鍵性。開發者應該針對已識別的風險設置護欄,並隨着新漏洞的發現增加額外的護欄。安全護欄應與強大的身份驗證和授權協議、嚴格的訪問控制以及標準的軟件安全措施相結合,形成一個多層防禦機制。指南列舉了多種類型的安全護欄,包括相關性分類器(確保響應在預期範圍內)、安全分類器(檢測不安全的輸入)、PII 過濾器(防止暴露個人身份信息)、審覈(記錄智能體的行爲)、工具安全措施(評估和控制工具的風險)、基於規則的保護(例如黑名單、輸入長度限制)和輸出驗證(確保響應符合品牌價值)。指南還介紹了在 Agents SDK 中設置安全護欄的方法,並強調了人爲干預作爲關鍵保障的重要性,尤其是在早期部署階段,以識別故障和邊緣案例.

總結和資源鏈接

指南最後總結指出,智能體標誌着工作流程自動化領域的新時代,它們能夠推理模糊性、跨工具執行操作以及處理多步驟任務,具有高度的自主性。構建可靠的智能體的關鍵在於強大的基礎(模型、工具和指令)、適當的編排模式以及關鍵的安全護欄。指南鼓勵用戶從小處着手,通過與真實用戶的驗證逐步擴展智能體的能力。最後,指南提供了 OpenAI API 平臺、OpenAI for Business、開發者文檔等更多資源的鏈接.

OpenAI 的這份“構建智能體實踐指南”爲希望探索和構建智能體系統的團隊提供了全面的指導和實用的建議,預示着各行業將加速邁向更加智能和自動化的未來。

文檔資源鏈接:https://cdn.openai.com/business-guides-and-resources/a-practical-guide-to-building-agents.pdf