Patronus AI推首個自助AI檢測API，打破AI幻覺的魔咒

在人工智能迅速發展的今天，AI “幻覺” 現象愈加頻繁，給許多企業帶來了不小的困擾。客戶服務聊天機器人自信地描述不存在的產品，金融 AI 編造市場數據，醫療機器人則提供危險的醫療建議。這些問題不再是單純的趣事，而是正在影響公司聲譽與盈利的重大隱患。

爲了應對這一挑戰，位於舊金山的初創公司 Patronus AI 宣佈推出全球首個自助服務平臺，旨在實時檢測和防止 AI 系統出現故障。這個平臺就像是 AI 系統的 “拼寫檢查器”，可以在問題發生前將其捕捉到。

Patronus AI 的首席執行官 Anand Kannappan 在接受採訪時表示，許多公司在生產環境中面臨 AI 故障，問題包括幻覺、安全漏洞和不可預測的行爲。根據公司的研究，領先的 AI 模型如 GPT-4在提示時44% 的機率會重複受版權保護的內容，而即使是先進的模型，在基本安全測試中也有超過20% 的概率生成不安全的響應。

爲了幫助企業提高 AI 系統的安全性，Patronus AI 提供了一系列創新功能。其中，最顯著的 “評估者” 功能允許企業用簡單的英語編寫定製化的評估規則。這種靈活性讓各行各業的公司能夠根據自身需求進行調整，如金融服務公司可以關注合規性，而醫療機構則可以關注患者隱私和醫療準確性。

平臺的核心是名爲 Lynx 的突破性幻覺檢測模型，其在識別醫療不準確性方面比 GPT-4高出8.3% 的準確率。此外，該平臺有兩種運作模式:一種用於實時監控，另一種用於深入分析。除了傳統的錯誤檢查，該公司還開發瞭如 CopyrightCatcher（版權檢測工具）和 FinanceBench(金融性能評估基準)等專用工具，爲企業提供全面的 AI 故障防護。

爲了讓更多企業能負擔得起這些安全工具，Patronus AI 採用了按需付費的定價模型，起價爲每1000次 API 調用10美元。早期採用者已經包括 HP、AngelList 和 Pearson 等大型企業，顯示出對 AI 安全投資的重視。

在 AI 發展迅速的今天，工具如 Patronus AI 的平臺不僅可以幫助企業降低風險，還有助於符合即將到來的法律法規。隨着 AI 系統的不斷進化，如何準確捕捉並修正這些 “幻覺” 將是企業面臨的重要挑戰。

產品入口:https://www.patronus.ai/

劃重點:
🌟 Patronus AI 推出全球首個自助 API，旨在實時檢測和預防 AI 幻覺現象。
🛡️ 該平臺允許企業用簡單英語創建定製評估規則，提供靈活的解決方案。
💰 採用按需付費模式，使更多企業能夠負擔得起 AI 安全工具。

Patronus AI推首個自助AI檢測API，打破AI幻覺的魔咒

相關推薦

融資 5000 萬美元！Patronus AI 打造“數字孿生世界”爲 AI 智能體做壓力測試

AI“幻覺”也得負法律責任！百度因AI生成虛假侵權信息被判道歉

AI 幻覺引發外交風波:英國警方緊急停用 Microsoft Copilot

谷歌拒絕爲 AI “幻覺” 負責，反擊誹謗訴訟

烏鎮峯會重磅發佈！360首發《大模型安全白皮書》，首提“全鏈路AI安全防線”應對智能時代新威脅

Patronus AI推首個自助AI檢測API，打破AI幻覺的魔咒

相關推薦

融資 5000 萬美元！Patronus AI 打造“數字孿生世界”爲 AI 智能體做壓力測試

AI“幻覺”也得負法律責任！百度因AI生成虛假侵權信息被判道歉

​AI 幻覺引發外交風波:英國警方緊急停用 Microsoft Copilot

谷歌拒絕爲 AI “幻覺” 負責，反擊誹謗訴訟

烏鎮峯會重磅發佈！360首發《大模型安全白皮書》，首提“全鏈路AI安全防線”應對智能時代新威脅

AI 幻覺引發外交風波:英國警方緊急停用 Microsoft Copilot