在生成式 AI 的激烈競爭中,算力與調用成本始終是開發者最爲關注的“生命線”。近日,谷歌在開發者生態層面釋放重磅利好:針對部分賬戶的Gemini API免費配額進行了大幅上調,部分模型的單分鐘 Token 處理上限(TPM)已正式提升至100萬大關。

根據測試反饋,此次調整的覆蓋範圍主要集中在 Gemini2.5系列模型。其中,Gemini2.5Flash 與 Flash-Lite 兩款輕量化模型在部分賬號中,已率先實現了100萬 Token/分鐘的超高吞吐能力。更爲吸引人的是,這一免費層級依然保持了“免綁卡、不限總量”的極低門檻,爲個人開發者和初創團隊提供了極具競爭力的低成本試錯空間。

image.png

不過,谷歌的此次策略性擴容呈現出明顯的“差異化”特徵。並非所有用戶都能享受到這一頂級額度,且不同模型之間的性能限制依然存在。目前,雖然 Token 處理上限大幅放寬,但各模型的請求頻率限制(RPM)仍被控制在每分鐘15次至30次不等,且每日請求總量(RPD)鎖定在1500次。此外,作爲該系列中的高端方案,Pro 版本模型目前暫未進入免費開放隊列。

對於關注隱私的開發者而言,需要額外留心的是,谷歌在服務條款中明確指出,其有權利用免費層級下的提示詞(Prompt)與反饋內容進行模型訓練。針對這一潛在的數據合規痛點,開發者可以通過官方查詢頁面查看當前賬戶的具體額度詳情,並根據業務敏感度評估是否選擇升級至付費版本。

行業人士認爲,谷歌此舉不僅是爲了通過高規格的免費配額吸引開發者遷入其 API 生態,更是爲了在開源模型衝擊下,通過極致的性價比穩固其在推理服務市場的領先地位。隨着這一免費策略的持續鋪開,個人開發者構建複雜 AI 應用的門檻有望被進一步壓低。