谷歌(Google)正式發佈了其 Gemini3系列中的最新成員——Gemini3.1Flash-Lite。作爲該系列中速度最快且最具成本效益的輕量級模型,它的問世標誌着谷歌在“高性價比AI”賽道上再次發力,試圖爲開發者提供更極致的實時交互體驗。

在性能表現上,Gemini3.1Flash-Lite 展現了令人驚歎的進化。根據權威評測平臺的數據顯示,與前代2.5Flash 相比,新模型的首字響應速度(TTFT)實現了2.5倍的爆發式增長,整體輸出速度也同步提升了45%。這種極低的延遲特性,使其能夠完美勝任需要即時反饋的對話機器人及實時處理場景。

除了“快”,這款模型還具備極高的“質價比”。谷歌爲其制定了極具競爭力的定價方案:每百萬輸入 Token 僅收0.25美元。在多項核心能力測試中,3.1Flash-Lite 甚至展現出了越級挑戰的實力,在多模態理解與邏輯推理指標上全面領先同級別競品,部分數據甚至超越了體積更大的前代模型。

此外,谷歌還在 AI Studio 和 Vertex AI 中爲該模型標配了創新的“思考層級”功能。開發者可以根據業務需求靈活調節模型的“思考深度”:對於簡單的翻譯或內容審覈,可追求極致效率;而面對複雜邏輯模擬或數據看板生成,則可激發更深層次的推理潛力。目前,該模型已通過 API 向預覽版用戶及企業級平臺同步開放,爲全球開發者構建低延遲 AI 應用提供了新利器。
劃重點:
⚡ 響應速度跨越式提升:首字響應提速2.5倍,整體速度提升45%,主打實時交互場景。
💰 極致成本控制:輸入價格低至0.25美元/百萬 Token,極大降低了大規模部署 AI 的門檻。
🧠 思考深度可控:新增“思考層級”調節功能,支持在效率與深度推理之間自由切換。
