3月19日、Cursorは自社開発のコード生成モデル「Composer 2」が正式リリースされたことを発表しました。発表直後、開発者コミュニティは大きな反響を呼んだのです—Cursorが公表したデータによると、このモデルはTerminal-Bench 2.0で61.7%という結果を達成し、Claude Opus 4.6が同じテスト環境で出した58.0%を上回っています。
Anthropicの看板モデルが自社のIDEに内蔵されたモデルに追い抜かれたというニュースが広がると、議論も当然のように巻き起こりました。

3つの主要なスコア
Cursorは今回3つのベンチマークデータを公開しました。
- Terminal-Bench 2.0(エージェント形式の端末コード作成タスク):Composer 2は61.7%を記録し、Claude Opus 4.6の58.0%を上回っています。しかし、OpenAIのGPT-5.4は75.1%と依然としてリードしています。
- CursorBench(Cursor内の実際のコード作成シナリオ):Composer 2は61.3%となり、前世代のComposer 1.5の44.2%から大幅に向上しており、Claude Opus 4.6の58.2%とも比較して優れています。
- SWE-bench Multilingual(多言語ソフトウェアエンジニアリング):Composer 2は73.7%を記録し、前世代との比較でも顕著な改善が見られます。
ただし注目すべき点があります:Anthropicは以前、Claude Opus 4.6が最適化設定でのTerminal-Bench 2.0のスコアを65.4%と公表していました。これはCursorのテスト環境での58.0%よりもかなり高い数値です。その違いはテストフレームワークにあると考えられています—CursorはHarborなどのサードパーティエージェント環境を使用し、5回のテストの平均値を取っていますが、Anthropicの数値は自社の最適化設定下でのものです。これらのデータは本来異なる参照枠内で得られたものであり、直接的に比較するのはちょっと無理があるかもしれません。Cursorはその点を明確に公告に記載しており、「結果はエージェント、ハーネスおよび設定に依存する」と明記されています。
コストはOpus 4.6の10分の1に
コストパフォーマンスこそがComposer 2の真の魅力です。
料金は入力/出力トークンあたりそれぞれ0.50ドル/2.50ドルで、Claude Opus 4.6の5ドル/25ドル、GPT-5.4の2.5ドル/15ドルと比べて明確な差があります。Cursorの説明では、Composer 2は長時間のコード作成タスク専用に設計されており、自社開発のRLトレーニングと「self-summarization(自己要約)」技術を組み合わせることで、速度とコストの両方を抑えることができたとされています。彼らの言葉では「先進的な知能+極限の高速性」ということになります。
Composer 2はCursorの第3世代の自社開発モデルで、前身は2025年10月のComposer 1と2026年2月の1.5バージョンです。今回のアップデートでは「long-horizon tasks(長期的なタスク)」に重点を置き、さらに軽量版をCursor IDEのデフォルトモデルとして採用しました。
この「逆襲」は何を意味するのか
Cursorが自社モデルをOpus 4.6と直接比較したのは、AIコードツール業界全体のロジックが変化している背景があるからです。
OpenAIやAnthropicは汎用的な最先端能力を追求している一方、Cursorのような垂直分野の企業は別の道を歩んでいます。特定のタスクで十分な性能を達成した上で、価格の優位性によって差をつける戦略です。VentureBeatやThe New Stackなどメディアの報道では、Composer 2が「マルチモデルルーティング」の実装を加速する可能性があると一般的に指摘されています。複雑な推論にはOpusやGPTを使い、日常的な頻繁なコード作成にはComposer 2を使うことで、どちらにも損しない使い方が可能になります。
Claude Opus 4.6は今年2月5日にリリースされ、Terminal-Bench 2.0やHumanity's Last Exam、GDPval-AAなどの多くのランキングでトップを走っていました。Cursorのこのデータは、少なくともコード生成という細分化された分野において、その結論に疑問を投げかけているのです。
現在の開発者のフィードバックは主に肯定的ですが、多くの方が実際にプロジェクトに適用してみてから判断したいと述べています—それは当然のことです。ベンチマークはあくまでベンチマークに過ぎません。Cursorは現在、サブスクリプションユーザー向けにIDE内でComposer 2の無料試用を提供しています。
データソース:Cursor公式公告および主流のテクノロジーメディア、2026年3月20日時点。リアルタイムのランクリストはtbench.aiまたはCursor公式サイトをご参照ください。
