GPT-5.2がAIブラウザ開発チャレンジで勝利し、長距離プログラミング能力でClaude Opus4.5を圧倒

AIがゼロから完全なWebブラウザを構築し始め、HTMLパーサーやCSSレイアウトエンジン、さらには自社製のJavaScript仮想マシンを含めることで、それまでコード生成にとどまらず、論理的一貫性、タスクの持続性、および工学的理解力に対する極限的な試練に直面しています。

最近、有名なAIプログラミングツールであるCursorは、業界を震撼させる内部テスト結果を公表しました。OpenAIの最新モデルであるGPT-5.2は、超長距離かつ高複雑度の自律的プログラミングタスクにおいて、AnthropicのClaude Opus4.5を顕著に上回り、これまでにない工程レベルの信頼性を示しました。

この実験は単なるコードスニペットの結合ではなく、数百万行のコードを含むシステムレベルのプロジェクトを何週間もかけて進行させることを要求します。その過程では、AIは繰り返し文脈を理解し、初期の設計欠陥を修正し、モジュール間の依存関係を調整し、常に最終的な目標を保つ必要があります。テストの結果、GPT-5.2は複雑な指示の連鎖を安定して従い、長時間の推論中に「タスクの逸脱」――つまり、元のタスクの意図から逸れてしまう一般的な問題――がほとんど起こらないことが明らかになりました。一方、Claude Opus4.5は短距離の質疑応答や単一ファイルのコード作成では優れた性能を発揮しますが、このような「マラソン式」の工学プロジェクトでは、タスクを早期に終了したり、簡略化された道を選んだり、または制御権を人間に引き渡す傾向があります。

この違いは、現在の大規模言語モデルにおける「自律的エージェント」能力の重要な分岐点を明らかにしています。つまり、誰も介入しなくても、人間のエンジニアチームのように大型プロジェクトを進めていけるかどうかです。Cursorチームによると、GPT-5.2はブラウザの構築だけでなく、Windows7シミュレーターの再現にも成功し、百万行を超えるコードを含む古きシステムの移行作業を主導しました。これらの作業は以前であれば何カ月もの人手が必要だったものです。それが今や、AIによって驚くほど一貫性を持って取り込まれています。

現在、GPT-5.2はCursorプラットフォームに統合されており、開発者は直接その能力を使用して高度なプログラミング協働を行うことができます。これにより、個人の開発効率が向上するだけでなく、新たなパターンの可能性を示唆しています。将来、AIがエンドツーエンドのソフトウェア開発を独立して担う「デジタルエンジニア」として登場するかもしれません。モデルが単なる関数の書き方を補助するだけでなく、アーキテクチャを計画し、システムをデバッグし、最適化を繰り返すことができれば、ソフトウェア開発の境界は完全に再構築されるでしょう。

MiniMax M2.5が正式リリース：プログラミング力はClaude Opusに匹敵、市場価値が急騰して1800億を突破

国内AI企業であるMiniMaxがエントリーモデルM2.5を発表しました。これは、エージェントシーンに最初から設計された世界初の生産用モデルとされています。このモデルはプログラミングとエージェント性能において優れた表現を示し、スタック開発をサポートし、技術と投資市場の注目を集めています。

マスクの予言：36か月以内に宇宙はAIの配置価格のバーゲン地となる。電力不足によりチップがひしめくことになる

マスクはポッドキャストで、地球の電力増加が停滞しているため、今後3年以内に宇宙がAIの配置コストが最も低く、効率的な場所になると予測した。彼は世界が電力の限界に直面していると指摘し、チップの生産量が指数関数的に増加している一方で、電力の増加はほぼ同じであると説明した。2026年末までには人類が電力不足に陥る可能性があると予言し、宇宙GPUが資本市場の注目を集めることになると述べた。

グーグル Gemini 3 Flashのアップグレード：新機能「Agentic Vision」でAIが専門家のように画像を深く見る

グーグルは、Gemini 3 Flashモデルに「Agentic Vision」という機能を追加しました。これは従来のAIビジョンモデルが一度に推測するという限界を打ち破ったものです。この機能により、AIは画像の詳細を積極的に探求し、複雑な内容を深く推論して分析できるようになりました。遠くの看板や回路図、または小さな文字など、従来の一度に全体を処理する方式では見逃されがちな細かい情報も捉えられるようになり、より人間の専門家に近い画像理解能力を実現しました。

AIの不安が広がる：25％以上のイギリスの労働者が5年以内に職を失うことを懸念

英国の調査によると、従業員の約27％が今後5年間でAIに職を奪われると懸念しており、職場の「技術不安」が浮き彫りになっている。また、雇用主と従業員のAIへの期待には大きな隔たりがあり、66％の雇用主がAI投資を増やしている一方、56％の従業員が会社のAI推進を感じている。....

GPT-5.2がAIブラウザ開発チャレンジで勝利し、長距離プログラミング能力でClaude Opus4.5を圧倒

関連推奨

MiniMax M2.5が正式リリース：プログラミング力はClaude Opusに匹敵、市場価値が急騰して1800億を突破

マスクの予言：36か月以内に宇宙はAIの配置価格のバーゲン地となる。電力不足によりチップがひしめくことになる

グーグル Gemini 3 Flashのアップグレード：新機能「Agentic Vision」でAIが専門家のように画像を深く見る

全国初のAIの幻覚による著作権侵害事件の判決：プラットフォームは責任を問われず、AIが設定した10万円の賠償は無効

AIの不安が広がる：25％以上のイギリスの労働者が5年以内に職を失うことを懸念