Google DeepMind 近日正式發佈 Gemini3.1Flash-Lite 預覽版,標誌着 Gemini3系列中速度最快、性價比最高的成員面世。作爲 Gemini2.5Flash-Lite 的迭代產品,新模型在保持每秒超360個 token 的極速輸出及5.1秒平均響應時間的基礎上,實現了智能水平的顯著跨越。根據 Artificial Analysis 智能指數監測,該模型得分較前代提升12分至34分,並在 Arena.ai 排行榜中憑藉1432的 Elo 分數展現出強勁的人類偏好競爭力。

在多模態與科學推理等核心維度,Gemini3.1Flash-Lite 的表現尤爲突出,其在 GPQA Diamond 測試中取得86.9% 的高分,MMMU-Pro 基準測試準確率達76.8%,性能已超越 Claude Opus4.6與 Kimi K2.5等重型模型。值得注意的是,該模型支持開發者自定義“思考”深度,使其能夠靈活適配從簡單的自動化翻譯到複雜的 UI 構建等多樣化場景。

然而,性能與速度的雙重進化伴隨着顯著的成本調整。Gemini3.1Flash-Lite 的每百萬輸入 token 價格上調至0.25美元,輸出價格則由前代的0.40美元大幅升至1.50美元,漲幅接近三倍。
這一價格策略反映了當前模型廠商在追求極速推理與高精度邏輯平衡時的成本壓力。隨着該模型在 Google AI Studio 及 Vertex AI 開放測試,輕量化模型市場正從單純的“低價競爭”轉向“高性能邏輯下放”的新階段。
