Anthropic 近日在 Claude Platform API 中正式推出顧問工具(Advisor Tool),爲開發者帶來一種全新的混合智能模式:讓更便宜、更快的模型負責全程執行任務,而在遇到複雜決策時,自動向最強大的模型“請教”策略建議。這一設計徹底顛覆了傳統“大模型拆任務、小模型執行”的 Agent 構建思路,實現了真正的“性價比最優解”。

創新機制:小模型主執行,大模型當顧問

在這一新功能中,Claude Sonnet 或 Haiku擔任“執行者”角色,負責工具調用、任務處理和結果整合。只有當執行者遇到自身難以決斷的難題時,纔會將當前上下文傳遞給Claude Opus作爲顧問。

Opus 僅提供高水平方案、糾正方向或戰略指導,隨後立即返回執行者繼續推進。整個過程中,Opus不直接調用工具,也不向用戶輸出最終結果,全程充當隱形“軍師”。這一反向設計讓大部分 Token 消耗發生在成本更低的模型上,僅在關鍵節點才動用高階算力。

image.png

性能與成本雙贏實測

根據官方測試數據:

Sonnet + Opus 顧問在 SWE-bench 多語言版本上,相比 Sonnet 單幹提升了2.7個百分點,同時每個任務的整體成本下降了11.9%

Haiku + Opus 顧問表現更爲驚人,在 BrowseComp 測試中得分從19.7% 躍升至41.2%,實現翻倍增長。雖然仍低於 Sonnet 單幹水平約29%,但成本僅爲 Sonnet 的15%,非常適合高併發、容忍度較高的批量場景。

這一成果充分證明:通過智能路由關鍵決策,開發者無需在“全程用 Opus 太貴”和“只用 Sonnet 不夠強”之間艱難抉擇。

使用方式極簡,一行配置即可啓用

開發者只需在 Messages API 的 tools 數組中添加類型爲advisor_20260301的工具定義即可。模型切換、上下文傳遞等複雜操作全部在單個 API 請求內部自動完成,無需手動管理多次調用或額外上下文。

還可通過max_uses參數靈活控制每次請求最多諮詢顧問的次數。賬單方面,執行者與顧問的 Token 消耗將分開計費,透明可控。目前該功能處於Beta 階段,需在請求頭中添加anthropic-beta: advisor-tool-2026-03-01才能使用。

行業意義:爲 Agent 開發打開新性價比大門

AIbase 認爲,顧問工具的推出標誌着 AI Agent 構建範式的重要演進。它讓開發者能夠以接近 Sonnet 的價格,95% 的時間享受 Sonnet 的執行效率,同時在5% 的關鍵決策節點獲得 Opus 級別的頂級判斷力。這一“執行者 + 顧問”的混合策略,不僅顯著降低了大規模部署成本,更大幅提升了中小模型在複雜任務中的可用性。

無論是構建代碼 Agent、瀏覽器自動化還是高量級數據處理場景,顧問工具都提供了一個高效、靈活且經濟的選項。Anthropic 再次用實際行動證明:模型能力的突破不僅來自參數規模,更來自架構與使用模式的創新。

隨着 Beta 階段的推進,預計這一功能將快速成爲開發者構建高性價比 AI Agent 的標配工具,值得密切關注其後續更新與更多基準表現。