人工知能分野でまた重要なアップデートが行われました。5月7日、OpenAIは公式にCodex for Chrome拡張機能が正式に導入されたことを発表しました。この動きは、AIアシスタントがユーザーの日常的なウェブ操作に深く関与し始めていることを示しています。

このプラグインのコアロジックは、Codexが直接Chromeブラウザを駆動できるようにすることにあります。ユーザーの許可を得た後、Codexは人間のように「ウェブページの内容を読み取る」ことや、内部システムを操作したり、複雑なフォームの入力も補助することができます。このような深いシステム呼び出しにより、AIは単にチャットボックス内で動作するものではなく、「デジタル従業員」として、ログイン済みのウェブサイトでタスクを実行できる存在となりました。

image.png

実測結果:簡単なタスクではミスが出るが、複雑な課題には強い

最近の機能テストでは、この拡張プログラムの性能に面白い逆差がありました。

驚いたことに、ブラウザのタブを整理するような論理的に単純な基本的なタスクを処理する際、Codexは時折操作ミスや認識不正確な場合があります。しかし、タスクの難易度が上がると、その処理能力はテスト者を驚かせます。

Apple、Huawei、Xiaomiなどの主要ブランドの最新スマートフォンに関する情報収集タスクにおいて、Codexは非常に高い統合効率を示しました。さらに、創作テーマの生成、Deepseekによる補助的な記事執筆、AIニュースの日報表の自動作成など、複雑で多段階のタスクにおいても、予想以上に高い完成度を達成しており、非常に高い生産性を持つことがわかりました。

image.png

役割の定位:信頼できるが注意が必要な「半自動アシスタント」

強力なタスク処理潜在力を示しているものの、現時点のCodex for Chromeは完璧ではありません。

現在のテストフィードバックによると、このツールはウェブ要素の正確な識別にはまだ改善の余地があります。専門家は、今しばらくの間、ユーザーはこれを「働ける半自動アシスタント」と見なし、非セキュリティセンシティブな日常業務では人手を大幅に解放しますが、本質的なプライバシーや高セキュリティを要するタスクに対しては、依然として人間による完全な監視と再確認が必要です。

アルゴリズムの繰り返し改善と認識精度の向上により、この「AIがブラウザを制御する」モデルは、私たちがインターネット情報を扱う方法を完全に変える可能性があります。