AWSは、re:Invent2025で4つの「Nova2」シリーズの独自大規模モデルを発表しました。このモデルはテキスト、画像、動画、音声などのマルチモーダルなシナリオをカバーしており、初めてウェブ検索とコード実行機能が内蔵されています。同社は、同等のタスクにおいて「業界をリードする価格性能比」を達成したと発表しています。
パフォーマンス比較
- Nova2Lite:高コストパフォーマンスな推論向け。15のベンチマークで13項目がClaude Haiku4.5と同等または上回り、17のベンチマークで11項目がGPT-5Miniと同等または上回る。コストは後者のおよそ50%
- Nova2Pro:複雑なエージェントタスク向け。16の評価で10項目がClaude Sonnet4.5と同等または上回り、18の評価で8項目がGemini3Pro Previewと同等または上回る。
- Nova2Sonic:エンドツーエンドの音声モデルで、リアルタイム遅延は600ms未満。百万トークンのコンテキストと非同期バックグラウンドタスクをサポート。
- Nova2Omni:業界初の統合マルチモーダルモデルで、テキスト/画像/動画/音声を入力し、テキスト+画像を出力でき、1つのモデルで理解と生成を完了。
技術的特徴
全モデルは「ウェブ検索 + コード実行」の2つのツールを統合しており、インターネット情報をリアルタイムで検索し、Pythonを実行することで、トレーニングデータに依存せず最新の事実に基づいた回答を保証します。AWSは、数万社がNovaシリーズを利用してコンテンツ制作、多段階の自動化、AIエージェント開発を行っていると述べています。
市場戦略
AWSは同時に「Nova Forge」というカスタムトレーニングサービスを発表しました。年間費用10万ドルで、プレトレーニングまたはポストトレーニングの段階で独自データを導入し、独自の先進モデルを構築できます。企業が大規模モデルを自前で構築するコストを「数億ドル」から「百万ドルレベル」まで削減することを目的としています。
業界の見方
