近日,來自麻省理工學院的初創公司 OpenAGI 正式亮相,並宣佈其新推出的 AI 模型 Lux 在計算機操作方面的表現超越了 OpenAI 和 Anthropic 的同類產品,且成本僅爲其十分之一。OpenAGI 的首席執行官秦增義表示,Lux 是一種基礎模型,旨在通過解析計算機截圖,自動執行桌面應用程序中的操作。

最新發佈的 Online-Mind2Web 基準測試中,Lux 的成功率達到了83.6%,而 OpenAI 的 Operator 僅爲61.3%,Anthropic 的 Claude Computer Use 則爲56.3%。這種顯著的性能差距讓業界人士對 Lux 的技術能力充滿期待。

與傳統的大型語言模型不同,Lux 採用了 “Agent主動預訓練” 的方法,專注於從計算機截圖和動作序列中學習。這一自我強化的訓練循環使得 Lux 能夠在不斷探索的過程中提高自身能力,從而實現了更高效的操作。

OpenAGI 還聲稱,Lux 的操作成本大約是 OpenAI 和 Anthropic 前沿模型的十分之一,且其速度也更快。不同於僅能處理瀏覽器任務的競爭對手,Lux 可以全面控制桌面應用程序,包括 Excel、Slack 等,極大地擴展了其市場潛力。公司同時發佈了開發者軟件開發工具包,允許第三方基於 Lux 開發應用。

在安全性方面,OpenAGI 爲 Lux 設計了內置的安全機制,當模型接收到可能違反安全政策的請求時,會拒絕執行,並向用戶發出警告。這一特性在當前 AI 代理快速發展的背景下尤爲重要。

秦增義博士背景深厚,曾參與開發多個廣受歡迎的 AI 模型,展示了較小團隊在技術上的潛力與創新。

劃重點:

- 🚀 OpenAGI 推出的 Lux AI 代理在計算機操作基準測試中獲得83.6% 的成功率,遠超 OpenAI 和 Anthropic。

- 💡 Lux 採用獨特的學習方式,通過計算機截圖和動作序列進行訓練,具有自我強化的能力。

- 🔒 安全機制內置於 Lux 中,能夠識別和拒絕潛在的危險請求,保障用戶數據安全。