グーグルは最近、Gemini APIの料金構造を更新し、ユーザーの推論使用ニーズにさらに適応できるようにしました。この更新により、スタンダード、エラスティック、プリオリティ、バッチ、キャッシュ版という複数の新しいサービスプランが追加されました。ユーザーは自身の実際のニーズに合わせて最適なプランを選択できます。
まず、スタンダードプランは基本的な推論サービスを提供しており、ユーザーは自身の利用状況に応じて選ぶことができます。エラスティックプランはイノベーティブな選択肢で、非ピークタイムの空きリソースを利用して、標準価格の50%オフの料金を提供します。このプランの目標遅延時間は1分から15分の間ですが、確実な遅延時間は保証されていません。これは、時間に厳密な要件がないアプリケーションに適しています。
また、バッチプランも標準料金の50%オフを提供しており、大量データ処理が必要なユーザーに適しています。遅延時間は最大24時間までかかることがあります。このプランは大規模なデータ処理シナリオに特に適しており、大量の情報検索を行う際にコストを大幅に節約できます。
キャッシュプランに関しては、キャッシュされたトークン数と保存期間に基づいて料金が計算され、頻繁に複雑な指示を呼び出すチャットボット、長動画分析、または大規模なドキュメントセットの検索に特化しています。このプランにより、ユーザーはストレージと計算リソースを効果的に管理し、システムの運用効率を向上させることができます。
プリオリティプランの価格は標準価格より75%〜100%高くなりますが、ミリ秒から秒単位で遅延時間を制御できます。このプランはリアルタイムレスポンスが必要なアプリケーション、例えばカスタマーサポートチャットボット、リアルタイム詐欺検出や重要なビジネスインテリジェントアシスタントなどに非常に適しています。グーグルは、ニーズがあるユーザーがプリオリティプランを選択することを推奨しており、アプリケーションのレスポンス速度と効率を最適に保つことを目的としています。
要点:
🌟 新たなGemini APIサービスプランが追加され、さまざまなユーザーのニーズに対応可能です。
⏳ エラスティックおよびバッチプランは標準料金の50%オフで、大規模なデータ処理に適しています。
⚡ プリオリティプランはミリ秒レベルのレスポンスを確保し、リアルタイムアプリケーションに適しています。
