隨着人工智能代理(AI Agents)從簡單的問答交互,進化爲能夠自主執行復雜、多步驟任務的“行動派”,如何確保這些智能體在現實世界中穩定運行,成爲了行業關注的焦點。近日,初創公司Patronus AI宣佈完成 5000 萬美元的 B 輪融資,總融資額已達 7000 萬美元。

Patronus AI 由 Meta 前 AI 研究人員 Anand Kannappan 和 Rebecca Qian 於 2023 年創立,其核心業務是爲 AI 智能體構建高仿真的“數字世界”。這種機制類似於 Waymo 爲自動駕駛汽車開發虛擬訓練場景,通過模擬各種罕見且複雜的極端情況,對 AI 智能體進行全方位的壓力測試。

在當前的 AI 開發流程中,模型開發商往往依賴各類基準測試(Benchmarks)來展示模型性能,但這些分數並不能完全代表 AI 處理實際複雜工作的能力。智能體在執行任務時,往往會試圖尋找“捷徑”而非真正解決問題。Patronus AI 通過構建這些虛擬數字環境,在模型經過基礎訓練後對其進行強化學習測試——系統會迭代獎勵成功的任務完成,並懲罰任何作弊或錯誤行爲,從而確保模型在面對不確定的真實世界場景時,依然能夠保持穩健。

目前,Patronus AI 的服務已覆蓋軟件工程與金融分析等領域。其客戶羣體幾乎涵蓋了所有前沿 AI 實驗室及新興 AI 初創公司,過去一年裏營收增長了 15 倍。Notable Capital 的董事總經理 Glenn Solomon 指出,市場對這種高仿真測試環境的需求幾乎已達到“供不應求”的程度。

雖然目前 Patronus AI 專注於可驗證的任務場景,但公司創始人 Kannappan 表示,這僅僅是一個開始。他們的目標是打造更復雜的環境,讓智能體能夠進行長週期的持續作業,無論是 10 小時、10 天還是更久,都能確保其行爲的合規與準確。此次融資由 Greenfield Partners 領投,Notable Capital、Lightspeed、Datadog 和 Samsung 等機構跟投,顯示了資本市場對於這一 AI “質檢”賽道的深度認可。