隨着人工智能(AI)技術的迅速發展,如何在大規模環境下有效應用這些技術成爲了一大挑戰。近日,Arthur正式推出了Arthur Engine,這是一款首個開源的實時 AI 評估引擎,旨在幫助團隊監控、調試和改進生成式 AI 及傳統機器學習(ML)模型。其最大的特點是無需依賴第三方工具,確保數據隱私安全,同時也完全免費。

QQ_1743576400312.png

在2025年,實時 AI 評估的重要性愈加凸顯。隨着 AI 技術的廣泛應用,相關風險也在不斷增加。例如,調查顯示,8.5% 的員工提示中包含敏感數據,模型在沒有持續監控的情況下會發生退化,慢速的迭代週期則可能導致模型性能下降。Arthur Engine通過提供即時的可見性、實時的保護措施以及在線模型優化,來解決這些問題,確保 AI 技術的健康發展。

Arthur Engine與傳統的 AI 監控工具相比,具有顯著的優勢。該引擎在本地運行,保障了數據的主權,並消除了合規風險。其核心功能包括實時 AI 評估,能夠即時檢測故障;主動保護措施,可以實時干預,防止模型產生錯誤輸出;可定製的評估指標,允許用戶根據特定的 AI 應用場景進行調整;同時,它支持所有模型,包括 GPT、Claude、Gemini 等開放權重模型,以及傳統的機器學習模型。

Arthur公司技術負責人徐媛(Cherie Xu)表示:“通過開源Arthur Engine,我們讓所有開發者都能夠輕鬆訪問 AI 信任與安全的工具,使他們能夠用高度可定製的高性能監控工具來保護 AI 系統。” Arthur Engine也是阿瑟公司更廣泛的 AI 性能監控套件的一部分,旨在幫助組織實時驗證 AI 輸出,及時發現性能波動,確保合規性和可解釋性。

此次開源發佈標誌着 AI 透明度、安全性和性能監控的新標準。有關Arthur Engine的更多信息可以在 GitHub 上找到,用戶還可以加入Arthur 平臺的等待名單。AI 正不斷改變世界,我們的目標是確保其良好運行。

入口:https://top.aibase.com/tool/arthur-engine

劃重點:  

🔍 Arthur 推出開源實時 AI 評估引擎,幫助團隊監控和改進 AI 模型。  

🔒 Arthur Engine在本地運行,保障數據隱私和合規性,消除第三方依賴。  

⚙️ 該引擎支持多種模型,並提供實時檢測和定製化評估功能。