OpenAIがCodexプラグインがブラウザを引き継ぐことを公式に発表　実測では複雑なタスクのパフォーマンスが驚くべきもの

人工知能分野でまた重要なアップデートが行われました。5月7日、OpenAIは公式にCodex for Chrome拡張機能が正式に導入されたことを発表しました。この動きは、AIアシスタントがユーザーの日常的なウェブ操作に深く関与し始めていることを示しています。

このプラグインのコアロジックは、Codexが直接Chromeブラウザを駆動できるようにすることにあります。ユーザーの許可を得た後、Codexは人間のように「ウェブページの内容を読み取る」ことや、内部システムを操作したり、複雑なフォームの入力も補助することができます。このような深いシステム呼び出しにより、AIは単にチャットボックス内で動作するものではなく、「デジタル従業員」として、ログイン済みのウェブサイトでタスクを実行できる存在となりました。

実測結果：簡単なタスクではミスが出るが、複雑な課題には強い

最近の機能テストでは、この拡張プログラムの性能に面白い逆差がありました。

驚いたことに、ブラウザのタブを整理するような論理的に単純な基本的なタスクを処理する際、Codexは時折操作ミスや認識不正確な場合があります。しかし、タスクの難易度が上がると、その処理能力はテスト者を驚かせます。

Apple、Huawei、Xiaomiなどの主要ブランドの最新スマートフォンに関する情報収集タスクにおいて、Codexは非常に高い統合効率を示しました。さらに、創作テーマの生成、Deepseekによる補助的な記事執筆、AIニュースの日報表の自動作成など、複雑で多段階のタスクにおいても、予想以上に高い完成度を達成しており、非常に高い生産性を持つことがわかりました。

役割の定位：信頼できるが注意が必要な「半自動アシスタント」

強力なタスク処理潜在力を示しているものの、現時点のCodex for Chromeは完璧ではありません。

現在のテストフィードバックによると、このツールはウェブ要素の正確な識別にはまだ改善の余地があります。専門家は、今しばらくの間、ユーザーはこれを「働ける半自動アシスタント」と見なし、非セキュリティセンシティブな日常業務では人手を大幅に解放しますが、本質的なプライバシーや高セキュリティを要するタスクに対しては、依然として人間による完全な監視と再確認が必要です。

アルゴリズムの繰り返し改善と認識精度の向上により、この「AIがブラウザを制御する」モデルは、私たちがインターネット情報を扱う方法を完全に変える可能性があります。

調査によると、プレイヤーはAIがゲームの画面を干渉することに不快感を抱いている。元のスタイルを残すことが主流の選択肢となった。

TechPowerUpの調査で、約2万票のうち58%のゲーマーがAIによる視覚効果の変更（照明、テクスチャ、キャラクターの顔など）に反対し、オリジナルの映像を好むことが判明。DLSS 5のレンダリングを原生より優れると評価したのはわずか8%だった。....

ChatGPT 5.5 Pro：1時間で博士レベルの数学問題を解く AIの数学力が新たなピークに達する

ケンブリッジ大学の数学教授でフィールズ賞受賞者のTimothy Gowers氏が、未公開のChatGPT 5.5 Proを使用した数学研究の経験を共有。このAIモデルは1時間で組合せ数学の未解決問題を解決し、学界の注目を集めた。Gowers氏は、大規模言語モデルが数学分野で既知情報の検索から未解決問題の解決へと進化したと指摘。....

ソフトバンク、OpenAI株式の担保融資規模を縮小　非上場AI資産への金融市場の姿勢が慎重に

ソフトバンクグループは、OpenAI株を担保とした融資規模を当初計画の100億ドルから40%減の60億ドルに縮小。融資期間は2年で、1年の延長オプション付き。未上場のOpenAI株の価格評価に対する一部債権者の懸念が背景にあり、非公開資産の評価安定性、処分効率、流動性の不確実性が影響した。....

MiniMaxの大規模モデルが名前を間違えた稀宇テクノロジー：特定のトークン後の訓練が不足していたため

稀宇科技の技術報告によると、M2シリーズモデルは「馬嘉祺」などの特定人名を正確に出力できず、トークナイザーによる「トークンシフト」問題が原因である。モデルが名前を「馬」と「嘉祺」に分割し、ベクトル空間が圧縮されて識別誤差が生じる。これは大規模モデル訓練における一般的だが隠れた欠陥を露呈し、特定人名の精密生成に影響を与えている。....

OpenAIがCodexプラグインがブラウザを引き継ぐことを公式に発表　実測では複雑なタスクのパフォーマンスが驚くべきもの

実測結果：簡単なタスクではミスが出るが、複雑な課題には強い

役割の定位：信頼できるが注意が必要な「半自動アシスタント」

関連推奨

マスクのオープンエイ・社に対する裁判で、2017年の社長日記に何が記されているのか？

調査によると、プレイヤーはAIがゲームの画面を干渉することに不快感を抱いている。元のスタイルを残すことが主流の選択肢となった。

ChatGPT 5.5 Pro：1時間で博士レベルの数学問題を解く AIの数学力が新たなピークに達する

ソフトバンク、OpenAI株式の担保融資規模を縮小　非上場AI資産への金融市場の姿勢が慎重に

MiniMaxの大規模モデルが名前を間違えた稀宇テクノロジー：特定のトークン後の訓練が不足していたため

OpenAIがCodexプラグインがブラウザを引き継ぐことを公式に発表 実測では複雑なタスクのパフォーマンスが驚くべきもの

実測結果：簡単なタスクではミスが出るが、複雑な課題には強い

役割の定位：信頼できるが注意が必要な「半自動アシスタント」

関連推奨

マスクのオープンエイ・社に対する裁判で、2017年の社長日記に何が記されているのか？

調査によると、プレイヤーはAIがゲームの画面を干渉することに不快感を抱いている。元のスタイルを残すことが主流の選択肢となった。

ChatGPT 5.5 Pro：1時間で博士レベルの数学問題を解く AIの数学力が新たなピークに達する

ソフトバンク、OpenAI株式の担保融資規模を縮小 非上場AI資産への金融市場の姿勢が慎重に

MiniMaxの大規模モデルが名前を間違えた 稀宇テクノロジー：特定のトークン後の訓練が不足していたため

OpenAIがCodexプラグインがブラウザを引き継ぐことを公式に発表　実測では複雑なタスクのパフォーマンスが驚くべきもの

ソフトバンク、OpenAI株式の担保融資規模を縮小　非上場AI資産への金融市場の姿勢が慎重に

MiniMaxの大規模モデルが名前を間違えた稀宇テクノロジー：特定のトークン後の訓練が不足していたため