谷歌近期對其 Gemini API 的計費結構進行了更新,旨在更好地滿足用戶的推理使用需求。這次更新帶來了多種新的服務檔位,包括標準、彈性、優先、批量和緩存版。用戶可以根據自身的實際需求選擇最合適的檔位。

首先,標準檔位提供了基礎的推理服務,用戶可以根據自己的使用情況進行選擇。彈性檔位則是一個創新的選擇,它利用非高峯時段的閒置算力資源,爲用戶提供了標準價格的五折優惠。這個檔位的目標延遲在 1 至 15 分鐘之間,但並不保證固定的延遲時間,適合那些對時間要求不太嚴格的應用場景。

此外,批量檔位同樣爲用戶提供了標準費率的五折優惠,適合需要處理大量數據的用戶,延遲時間最長可達 24 小時。此檔位特別適用於大規模的數據處理場景,用戶在進行大量信息查詢時可以大大節省成本。

在緩存檔位方面,計費將依據緩存的詞元數量與存儲時長進行,特別適合需要頻繁調用複雜指令的對話機器人、長視頻分析或大規模文檔集的查詢。這個檔位使得用戶能夠有效管理存儲和計算資源,提高系統的運行效率。

優先檔位的定價則比標準價格高出 75% 至 100%,但能夠在毫秒到秒級內控制延遲。這一檔位非常適合那些需要實時響應的應用,如客服聊天機器人、實時欺詐檢測和關鍵業務智能助手等場景。谷歌建議有需求的用戶選擇優先檔位,以確保他們的應用程序在響應速度和效率上的最佳表現。

劃重點:  

🌟 新增多種 Gemini API 服務檔位,滿足不同用戶需求。  

⏳ 彈性與批量檔位提供五折優惠,適合大規模數據處理。  

⚡ 優先檔位確保毫秒級響應,適合實時應用場景。