AWSは、re:Invent2025で4つの「Nova2」シリーズの独自大規模モデルを発表しました。このモデルはテキスト、画像、動画、音声などのマルチモーダルなシナリオをカバーしており、初めてウェブ検索とコード実行機能が内蔵されています。同社は、同等のタスクにおいて「業界をリードする価格性能比」を達成したと発表しています。

パフォーマンス比較

- Nova2Lite:高コストパフォーマンスな推論向け。15のベンチマークで13項目がClaude Haiku4.5と同等または上回り、17のベンチマークで11項目がGPT-5Miniと同等または上回る。コストは後者のおよそ50%

- Nova2Pro:複雑なエージェントタスク向け。16の評価で10項目がClaude Sonnet4.5と同等または上回り、18の評価で8項目がGemini3Pro Previewと同等または上回る。

- Nova2Sonic:エンドツーエンドの音声モデルで、リアルタイム遅延は600ms未満。百万トークンのコンテキストと非同期バックグラウンドタスクをサポート。

- Nova2Omni:業界初の統合マルチモーダルモデルで、テキスト/画像/動画/音声を入力し、テキスト+画像を出力でき、1つのモデルで理解と生成を完了。

技術的特徴

全モデルは「ウェブ検索 + コード実行」の2つのツールを統合しており、インターネット情報をリアルタイムで検索し、Pythonを実行することで、トレーニングデータに依存せず最新の事実に基づいた回答を保証します。AWSは、数万社がNovaシリーズを利用してコンテンツ制作、多段階の自動化、AIエージェント開発を行っていると述べています。

市場戦略

AWSは同時に「Nova Forge」というカスタムトレーニングサービスを発表しました。年間費用10万ドルで、プレトレーニングまたはポストトレーニングの段階で独自データを導入し、独自の先進モデルを構築できます。企業が大規模モデルを自前で構築するコストを「数億ドル」から「百万ドルレベル」まで削減することを目的としています。

業界の見方