傳統搜索引擎爲人類瀏覽而設計的“藍色鏈接列表”正在成爲 AI 智能體(Agents)高效工作的瓶頸。在處理複雜研究任務時,AI 只能通過硬性調整搜索詞進行多輪、手工作坊式的 API 調用,面臨架構僵化與上下文窗口被垃圾信息塞滿的痛點。
爲了打破這一侷限,Perplexity 近日發佈了一項名爲“搜索即代碼”(Search as Code, 簡稱 SaC)的全新架構。該技術不再讓模型調用現成的、整體式的搜索 API,而是允許 AI 模型以 Python 代碼的形式,動態構建並運行自定義的搜索工作流程。

三層核心架構
Perplexity 的 SaC 架構垂直堆棧共分爲三層:
模型層(最頂層): 負責理解複雜任務並制定高層面的搜索策略。
安全沙箱(中間層): 爲代碼提供運行環境,並具備用於存儲中間狀態的文件系統。
智能搜索 SDK(最底層): 將檢索、扇出、過濾、去重、重新排序和解析字段等原子級操作打包成基礎原語函數,賦予生成的代碼組件級的搜索基礎設施訪問權限。
通過這種設計,AI 智能體可以並行執行查詢、以編程方式過濾無關信息,並將高度提煉的相關結果提取到上下文窗口中,從而保證了長文本研究任務中的思維連貫性。
CVE 漏洞研究實測:性能躍升與 Token 暴降
爲了驗證該架構在現實世界中的表現,Perplexity 針對一項混亂的專業網絡安全任務進行了測試:追蹤200個在2023年至2025年間發佈的關鍵軟件漏洞(CVE),並精確提取官方公告、受影響軟件及修復版本。

在 SaC 的支持下,AI 模型自發編寫了一個“三階段腳本”:先針對不同廠商(如 Mozilla、Google)的公告格式運行並行定製化搜索;隨後自動掃描結果、捕捉信息遺漏並進行定向補充查詢;最後利用 Schema(模式)校驗確保漏洞數據完全對齊。
測試結果表明,該系統在精準完成任務的同時,比傳統標準管道節省了85% 的 Token 消耗。在 Perplexity 自身的基準測試集(包含 DSQA、BrowseComp、HLE、WideSearch 和最新推出的廣度研究基準 WANDR)中,SaC 在五項測試中獨佔四項鰲頭,相比舊架構實現了巨大的性能飛躍。尤其在 WANDR 基準上,相對提升幅度高達45%。
代碼成爲 AI 的新操作層
行業調查報告指出,編寫代碼正逐漸成爲 AI 智能體與物理世界交互的默認方式。傳統的軟件依賴確定性指令,而前沿大模型則在 Token 空間進行推理,最強大的系統往往將兩者結合——即利用大模型制定策略,利用確定性的運行環境進行批量處理與過濾,並將搜索基礎設施作爲輸入/輸出(I/O)層。
目前,“搜索即代碼”功能已正式在
