近日,谷歌正式宣佈其最新的 Gemini2.5Flash-Lite 模型已進入穩定版本(GA)。這一版本被稱爲是速度最快、成本最低的模型,標誌着谷歌在人工智能領域的又一重要進展。Gemini2.5Flash-Lite 在性能和成本之間取得了良好的平衡,能夠原生支持高達100萬 token 的上下文,帶來了諸多高級功能。

image.png

Gemini2.5Flash-Lite 的定價策略也相當引人注目:每百萬輸入 token 的費用僅爲0.10美元,而每百萬輸出 token 的費用爲0.40美元,這與競爭對手 GPT-4.1Nano 的價格相當。此外,相較於早期的預覽版,這一模型在音頻輸入方面的定價降低了40%,顯示出其對用戶需求的敏感度和對市場競爭的迴應。

在各項基準測試中,Gemini2.5Flash-Lite 的表現超越了之前的2.0版本,涵蓋了編碼、數學、推理和多模態理解等多個領域。該模型支持100萬 token 的上下文窗口,具備可控的思考預算(thinking budgets),並提供多種原生工具,如與 Google 搜索的結合、代碼執行以及 URL 上下文的功能。

開發者們可以通過簡單的代碼指令使用 Gemini2.5Flash-Lite 模型,具體方式是指定模型爲 gemini-2.5-flash-lite。需要注意的是,原有的預覽版別名計劃將於8月25日移除,開發者們應儘快適應新的版本。

此次 Gemini2.5Flash-Lite 的發佈,標誌着谷歌在人工智能技術方面不斷創新和優化的決心,爲開發者提供了更加高效且經濟實惠的選擇,未來無疑會在多種應用場景中發揮更大的作用。

劃重點:

🌟 Gemini2.5Flash-Lite 是谷歌最新發佈的速度最快、成本最低的 AI 模型,已進入穩定版本(GA)。

💰 該模型每百萬輸入 token 定價爲0.10美元,每百萬輸出 token 定價爲0.40美元,相比預覽版音頻輸入價格降低了40%。

🔧 開發者可通過指定模型名 gemini-2.5-flash-lite 使用新版本,原有預覽版別名將於8月25日移除。