人工知能の分野において、マイクロソフト研究院のAI Frontiersラボは最近、新しくてFara1.5シリーズのスマートエージェントモデルをリリースしました。このシリーズはブラウザのシナリオに特化しており、コンピュータの使用をよりスマートにすることが目的です。Fara1.5シリーズには3つの異なるパラメータサイズのバージョンがあり、それぞれ4B、9B、27Bです。

このスマートエージェントモデルは、MagneticLiteサンドボックスブラウザインターフェースと連携して使用され、ブラウザのスクリーンショットを直接読み取ることができ、マウスやキーボードの操作を模倣し、さまざまなウェブページのタスクを自動的に完了します。Fara1.5の作業フローは「観察—思考—行動」のループに基づいており、各ステップでは過去の会話と直近の3枚のブラウザスクリーンショットが組み合わされて、推論内容とその後の行動が生成されます。

image.png

性能面では、Fara1.5-27BはOnline-Mind2Webベンチマークテストで72%のタスク成功率を記録し、OpenAIのOperator(58.3%)やGemini2.5Computer Use(57.3%)などの競合製品よりも顕著に高いです。さらに、Fara1.5-9Bバージョンでも成功率は63.4%に達しています。このような効率的な性能により、Fara1.5シリーズは多くのエージェントモデルの中で際立っています。

Fara1.5のトレーニングには約200万件のサンプルが微調整に使用され、そのうち60%はウェブトラッキングから、12.8%は合成環境から、12.5%はユーザーとの対話から、8.8%は事実のアンカリングから、4.9%はビジュアル質問から得られています。このような多様なトレーニングデータは、モデルの適応性と知能レベルを大幅に向上させました。

ユーザーの安全とプライバシーを確保するために、Fara1.5は以下の3つの状況で作業を自動的に停止し、ユーザーに尋ねます:個人情報が不足している場合、タスクの説明が曖昧な場合、または承認されていない不可逆的な操作を行う予定の場合です。さらに、すべての操作記録はMagneticLiteサンドボックスに保存され、エージェントとユーザーのデバイス間のセキュリティ境界を保証します。

技術の進歩に伴い、マイクロソフトのFara1.5シリーズはユーザーにとってよりスマートで使いやすいブラウジング体験を提供し、日常的なコンピュータ使用における人工知能の巨大な可能性を示しています。

重要なポイント:

🌟 Fara1.5シリーズモデルのタスク成功率は72%に達し、OpenAIなど競合を上回っています。

🖥️ このモデルはサンドボックスブラウザインターフェースを通じてウェブページのタスクを完了し、操作方法は直感的で使いやすいです。

🔒 ユーザーの安全を強調し、曖昧なタスクと個人情報保護について積極的に尋ね、プライバシーを確保します。