MIT 新創公司 OpenAGI 推出 AI Agent，聲稱超越 OpenAI 與 Anthropic

近日，來自麻省理工學院的初創公司 OpenAGI 正式亮相，並宣佈其新推出的 AI 模型 Lux 在計算機操作方面的表現超越了 OpenAI 和 Anthropic 的同類產品，且成本僅爲其十分之一。OpenAGI 的首席執行官秦增義表示，Lux 是一種基礎模型，旨在通過解析計算機截圖，自動執行桌面應用程序中的操作。

在最新發佈的 Online-Mind2Web 基準測試中，Lux 的成功率達到了83.6%，而 OpenAI 的 Operator 僅爲61.3%，Anthropic 的 Claude Computer Use 則爲56.3%。這種顯著的性能差距讓業界人士對 Lux 的技術能力充滿期待。

與傳統的大型語言模型不同，Lux 採用了 “Agent主動預訓練” 的方法，專注於從計算機截圖和動作序列中學習。這一自我強化的訓練循環使得 Lux 能夠在不斷探索的過程中提高自身能力，從而實現了更高效的操作。

OpenAGI 還聲稱，Lux 的操作成本大約是 OpenAI 和 Anthropic 前沿模型的十分之一，且其速度也更快。不同於僅能處理瀏覽器任務的競爭對手，Lux 可以全面控制桌面應用程序，包括 Excel、Slack 等，極大地擴展了其市場潛力。公司同時發佈了開發者軟件開發工具包，允許第三方基於 Lux 開發應用。

在安全性方面，OpenAGI 爲 Lux 設計了內置的安全機制，當模型接收到可能違反安全政策的請求時，會拒絕執行，並向用戶發出警告。這一特性在當前 AI 代理快速發展的背景下尤爲重要。

秦增義博士背景深厚，曾參與開發多個廣受歡迎的 AI 模型，展示了較小團隊在技術上的潛力與創新。

劃重點:
- 🚀 OpenAGI 推出的 Lux AI 代理在計算機操作基準測試中獲得83.6% 的成功率，遠超 OpenAI 和 Anthropic。
- 💡 Lux 採用獨特的學習方式，通過計算機截圖和動作序列進行訓練，具有自我強化的能力。
- 🔒 安全機制內置於 Lux 中，能夠識別和拒絕潛在的危險請求，保障用戶數據安全。

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

畢馬威針對全球20國2145名高管的調查顯示，AI新的按量計費模式正讓企業高管們感到不安。過去依賴固定價格合同、由AI公司補貼算力成本的模式難以爲繼，隨着算力價格持續攀升，整個行業被迫轉向防守，企業低價使用AI的階段正走向終結。

MIT 新創公司 OpenAGI 推出 AI Agent，聲稱超越 OpenAI 與 Anthropic

相關推薦

OpenAI炮轟AI評測"標杆"： 731 道題近三成有缺陷， 8 個月通過率從23%飆到80%已失靈

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案

全球首部AI女演員主演電影開機：沒有身體沒有童年，卻能調取全人類記憶

AI編碼圈再傳重磅：瑞典新星Lovable估值或將翻倍至 132 億美元

MIT 新創公司 OpenAGI 推出 AI Agent，聲稱超越 OpenAI 與 Anthropic

相關推薦

OpenAI炮轟AI評測"標杆"： 731 道題近三成有缺陷， 8 個月通過率從23%飆到80%已失靈

AI"按量計費"嚇退企業高管：近三分之一承認不懂經濟賬，算力賬單成了黑箱

​一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案

全球首部AI女演員主演電影開機：沒有身體沒有童年，卻能調取全人類記憶

AI編碼圈再傳重磅：瑞典新星Lovable估值或將翻倍至 132 億美元

一個普通攝像頭就能自主導航：Mistral發佈8B模型Robostral Navigate，性能碾壓多攝像頭方案