最近、マサチューセッツ工科大学(MIT)のスタートアップ企業であるOpenAGIが正式に登場し、新たにリリースしたAIモデル「Lux」がコンピュータ操作においてOpenAIやAnthropicの同種製品を上回り、コストはその10分の1であることを発表しました。OpenAGIのCEOである秦増義氏は、Luxがコンピュータスクリーンショットを解析し、デスクトップアプリケーション内の操作を自動化することを目的としたベースモデルであると語っています。
最新のOnline-Mind2Webベンチマークテストでは、Luxの成功確率は83.6%で、OpenAIのOperatorは61.3%、AnthropicのClaude Computer Useは56.3%です。この顕著な性能差により、業界関係者からはLuxの技術能力に高い期待が寄せられています。
従来の大型言語モデルとは異なり、Luxは「エージェント主導の予トレーニング」という方法を採用しており、コンピュータスクリーンショットとアクションシーケンスから学習しています。この自己強化型のトレーニングループにより、Luxは継続的な探索を通じて自身の能力を向上させ、より効率的な操作が可能となっています。
OpenAGIは、Luxの操作コストがOpenAIやAnthropicの最先端モデルの約10分の1であり、さらに速度も速いと主張しています。競合他社がブラウザタスクに限定されているのに対し、LuxはExcelやSlackなど、デスクトップアプリケーションを全面的に制御できるため、市場の可能性を大幅に拡大しています。また、会社は開発者向けのソフトウェア開発キットを公開し、第三者がLuxを基盤としてアプリケーションを開発できるようにしています。
セキュリティ面では、OpenAGIはLuxに組み込みのセキュリティメカニズムを設計し、モデルがセキュリティポリシーに違反するような要求を受けた場合、実行を拒否し、ユーザーに警告を表示します。この特徴は、現在AIエージェントが急速に進化している状況において特に重要です。
秦増義博士は非常に深い背景を持ち、多くの人気のあるAIモデルの開発に関与してきました。これは、小さなチームでも技術的な潜在力とイノベーションが可能であることを示しています。
重要なポイント:
- 🚀 OpenAGIがリリースしたLux AIエージェントは、コンピュータ操作のベンチマークテストで83.6%の成功率を記録し、OpenAIやAnthropicを大きく上回っています。
- 💡 Luxは独自の学習方法を取り入れており、コンピュータスクリーンショットとアクションシーケンスを用いてトレーニングされ、自己強化の能力を持っています。
- 🔒 セキュリティメカニズムはLuxに内蔵されており、潜在的な危険な要求を識別・拒否し、ユーザーのデータセキュリティを確保しています。
