融資 5000 萬美元！Patronus AI 打造“數字孿生世界”爲 AI 智能體做壓力測試

隨着人工智能代理（AI Agents）從簡單的問答交互，進化爲能夠自主執行復雜、多步驟任務的“行動派”，如何確保這些智能體在現實世界中穩定運行，成爲了行業關注的焦點。近日，初創公司Patronus AI宣佈完成 5000 萬美元的 B 輪融資，總融資額已達 7000 萬美元。

Patronus AI 由 Meta 前 AI 研究人員 Anand Kannappan 和 Rebecca Qian 於 2023 年創立，其核心業務是爲 AI 智能體構建高仿真的“數字世界”。這種機制類似於 Waymo 爲自動駕駛汽車開發虛擬訓練場景，通過模擬各種罕見且複雜的極端情況，對 AI 智能體進行全方位的壓力測試。

在當前的 AI 開發流程中，模型開發商往往依賴各類基準測試（Benchmarks）來展示模型性能，但這些分數並不能完全代表 AI 處理實際複雜工作的能力。智能體在執行任務時，往往會試圖尋找“捷徑”而非真正解決問題。Patronus AI 通過構建這些虛擬數字環境，在模型經過基礎訓練後對其進行強化學習測試——系統會迭代獎勵成功的任務完成，並懲罰任何作弊或錯誤行爲，從而確保模型在面對不確定的真實世界場景時，依然能夠保持穩健。

目前，Patronus AI 的服務已覆蓋軟件工程與金融分析等領域。其客戶羣體幾乎涵蓋了所有前沿 AI 實驗室及新興 AI 初創公司，過去一年裏營收增長了 15 倍。Notable Capital 的董事總經理 Glenn Solomon 指出，市場對這種高仿真測試環境的需求幾乎已達到“供不應求”的程度。

雖然目前 Patronus AI 專注於可驗證的任務場景，但公司創始人 Kannappan 表示，這僅僅是一個開始。他們的目標是打造更復雜的環境，讓智能體能夠進行長週期的持續作業，無論是 10 小時、10 天還是更久，都能確保其行爲的合規與準確。此次融資由 Greenfield Partners 領投，Notable Capital、Lightspeed、Datadog 和 Samsung 等機構跟投，顯示了資本市場對於這一 AI “質檢”賽道的深度認可。

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

微軟內部AI操作系統Project Aion曝光，專爲AI PC打造。系統基於Edge與網頁輕量化技術，摒棄傳統開始菜單與桌面圖標，任務欄直喚Copilot成唯一交互入口。平臺聚焦信息流、創作與實時資訊，獨創“空間”功能可自動歸類網頁，交互邏輯徹底重構。

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

阿里巴巴內部發文，要求員工停止使用 Anthropic Claude 全系產品，包括 Sonnet、Opus、Fable 等模型及 Claude Code 等智能體工具，最後期限爲 7 月 10 日。此舉與公司年初開放 AI 使用、提供內部模型免費額度並報銷外部模型的政策形成對比，預示着其在 AI 工具策略上的收緊和向自研體系的迴歸。

融資 5000 萬美元！Patronus AI 打造“數字孿生世界”爲 AI 智能體做壓力測試

相關推薦

讓機器人學會番茄炒蛋的“幕後推手”：Genesis AI 開源全棧訓練場

AI 智能體 Elements Claw 成功“閉環”超導材料研發

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具