人工知能会社アンスラピックは、最新のエリートモデル「Claude Opus4.5」を正式に発表しました。同社の公式説明によると、このモデルはコード作成(coding)、エージェント(スマートエージェント)操作およびコンピュータ使用などの重要な生産性シナリオにおいて、現在の世界で最も先進的なレベルに達しています。また、研究やプレゼンテーション、エクセルシートなどの一般的なタスクにおいても大幅な向上が見られます。

核心能力: コード作成、推論と長期的なタスク管理
ソフトウェア工学の能力が大幅に向上
現実世界でのソフトウェア工学テストにおいて、Opus4.5は非常に高い性能基準に達しました。アンスラピックは、複雑で多システムのバグ修正タスクにおいて、独自の推論で修正計画を導き出すことができ、過度なガイドラインなしでも動作することを示しています。Terminal Benchテストでは、このモデルは前世代のSonnet4.5より約15%優れたパフォーマンスを示します。開発者のフィードバックによると、Opus4.5はコードの移行やリファクタリングにおいて特に得意であり、推論プロセスがより複雑ですが効率的です。
長期的な作業と自動化エージェント
Opus4.5は比較的長い文脈(context)ウィンドウをサポートしており、公式ページによると< strong>200K tokensです。(アンスラピック)
アンスラピックは開発者プラットフォームに< strong>「effort パラメータ」を新設し、開発者がモデルの計算強度を調整できるようにしました。速度とコスト削減のために「思考」の強度を下げるか、品質を向上させるために最適出力を追求するかを選べます。
マルチエージェント(multi-agent)タスクにおいて特に優れた性能を発揮します。アンスラピックの評価によると、このモデルは複雑なエージェントシステム内でサブエージェントの調整能力が向上し、タスクの完了品質と効率が著しく向上しています。

通常のオフィスと生産性ツールの能力向上
Claudeアプリケーションでは、長時間の対話が文脈の限界に達することがなくなりました。モデルは初期の内容を自動的に要約して、対話の連続性を維持します。< strong style="text-indent: 2em;">Chrome拡張機能はMaxユーザー向けに全面的に公開され、以前は試用状態でした。< strong style="text-indent: 2em;">Excel統合機能も更新されています。内部評価によると、Opus4.5は複雑な財務モデリングと自動化タスクにおける正確性が約20%向上し、効率が約15%向上しています。
Claude Codeのデスクトップ版では、複数のセッションを並列で実行できます(例えば、デバッグ、ドキュメント作成、テストなどのエージェントタスク用)。また、Plan Mode(計画モード)はさらに強化されており、モデルは本格的な実行前に編集可能な計画ファイル(例:plan.md)を提示し、問題を明確にします。(アンスラピック)
性能と効率の改善: より強力で、節約的で、柔軟性がある
Opus4.5は、コード作成(SWE-bench)、エージェント能力(τ²-bench)、推論、数学、視覚など多くの内部ベンチマークで優れた性能を示しています。効率面では、新しいモデルはトークン使用量を大幅に減少させています。たとえば、ある設定では、effortパラメータを調整することで、Opus4.5はSonnet4.5の性能を維持または上回る一方で、出力トークン数を最大で< strong style="text-indent: 2em;">76%削減できます。
また、文脈圧縮(context compaction)とメモリ管理の向上により、長期的な運用がより安定し、大規模で継続的なエージェントワークフローに適しています。

セキュリティ: 対応性と頑丈さの両方を強化
アンスラピックは、Opus4.5がこれまでで最も対応性(alignment)が強く、最も頑丈な先進モデルの一つであると述べています。悪意のあるプロンプトインジェクション(prompt injection)攻撃に対する防御能力は、以前のバージョンよりも優れています。アンスラピックは、業界内の他の先進モデルよりも誤導されにくいと述べています。安全評価は幅広い範囲をカバーしており、アクティブとパッシブのリスク経路が含まれています。完全な評価結果と方法は、Opus4.5の「system card」に記録されています。

価格、利用可能性、オープンプラットフォーム
価格: Claude APIを通じてOpus4.5を使用する際の費用は、< strong>100万入力トークンあたり5ドル、< strong>100万出力トークンあたり25ドルです。
利用可能性: このモデルはアンスラピックの自社アプリケーションでリリースされ、開発者向けにAPIで提供されています。同時に、< strong>3つのクラウドプラットフォーム(Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry)でも利用可能です。
利用制限の変更: Opusへのアクセス権を持つユーザー(例: Max、Team Premiumなど)に対して、アンスラピックは以前のOpusモデルの利用「上限(cap)」制限を解除し、全体的な利用枠を向上させました。これにより、日常業務へのより広範な応用が可能になります。
影響
エンジニアと開発者: Opus4.5はコード作成、デバッグ、リファクタリング、大規模なマルチエージェント協力において優れた性能を発揮し、ソフトウェア開発効率を大きく向上させ、人間による繰り返しの介入を減らす可能性があります。
企業とオフィスの自動化: ExcelやChromeなどのツールとの統合により、企業はAIを日常的なオフィスプロセスに簡単に組み込むことができ、分析と自動化を加速します。
AIエージェント(Agent)エコシステム: 強力な長期的な推論能力とメモリ管理により、複雑で長期的なエージェントの実装が期待されます(例: プロセス自動化、カスタマーサービス、研究開発アシスタントなど)。
セキュリティと信頼性: アンスラピックは、対応性(alignment)と攻撃耐性(robustness)の向上を強調しており、企業や重要なタスクにおける信頼性を高めることが期待されます。
