Googleは本日、Geminiモデルシリーズの最新版であるGemini-1.5-Pro-002とGemini-1.5-Flash-002を発表しました。今回のアップデートは、性能の大幅な向上だけでなく、驚くべき価格値下げも実現し、AI開発業界に大きな波を起こすことは間違いありません。

まず、最も注目すべきは大幅な価格改定です。新モデルの使用コストは半減し、50%以上の値下げを実現しました。同時に、性能も大幅に向上しています。Gemini 1.5 Flashの処理速度は2倍になり、1.5 Proはほぼ3倍になっています。これは、開発者はより低コストでより高速な出力と短い遅延を得ることができ、開発効率が大幅に向上することを意味します。

image.png

性能面では、新版Geminiモデルはあらゆる面で向上を見せています。特に数学、長文処理、視覚タスクにおいては著しい進歩が見られます。例えば、1000ページ以上のPDF文書の処理、数万行のコードを含む質問への回答、1時間の長尺ビデオからの有用な情報の抽出などが容易にできるようになりました。難易度の高いベンチマークテストであるMMLU-Proでは、約7%の性能向上を実現しました。さらに注目すべきは、MATHとHiddenMathのベンチマークテストでは、最大20%もの向上を達成したことです。

image.png

Googleは、モデルのレスポンス品質も最適化しました。新バージョンは、コンテンツの安全性を確保しながら、より有益で簡潔な回答を提供します。要約、質疑応答、情報抽出などのタスクでは、出力の長さが以前と比べて5%から20%短縮され、効率の向上とコスト削減にも繋がっています。

企業ユーザーにとって、Gemini 1.5 Proの長文処理能力(最大200万語)とマルチモーダル能力は、全く新しいアプリケーションシナリオを開きます。2024年10月1日からは、入力トークン、出力トークン、増分キャッシュトークンの価格がそれぞれ64%、52%、64%値下げされ、AIの使用コストの大幅な削減に繋がります。

image.png

使用制限についても、Googleは大幅な調整を行いました。Gemini 1.5 Flashの有料サービスの速度制限は、毎分2000回のリクエストに引き上げられ、1.5 Proは1000回に引き上げられました。これにより、開発者はより柔軟な開発が可能になります。

セキュリティは、Googleが常に重視している分野です。新モデルは、ユーザーの指示に従いつつ、セキュリティをさらに強化しています。Googleは、フィルタのデフォルト設定も調整し、開発者にさらなる自主性を提供しています。

さらに、Googleは改良版のGemini 1.5 Flash-8B実験モデルも発表しました。テキストとマルチモーダルアプリケーションの両方で優れたパフォーマンスを発揮します。このバージョンは既にGoogle AI StudioとGemini APIで公開されており、開発者に多くの選択肢を提供しています。

Gemini Advancedユーザーは、まもなくチャット用に最適化されたGemini 1.5 Pro-002バージョンを利用できるようになります。

参考資料:https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/