正文

響應快如閃電！谷歌發佈 Gemini 3.1 Flash-Lite：首字提速 2.5 倍，算力成本再創新低

aibase

發布於AI新閒資訊

時間 :Mar 4, 2026

閱讀 :1分鐘

谷歌（Google）正式發佈了其 Gemini3系列中的最新成員——Gemini3.1Flash-Lite。作爲該系列中速度最快且最具成本效益的輕量級模型，它的問世標誌着谷歌在“高性價比AI”賽道上再次發力，試圖爲開發者提供更極致的實時交互體驗。

在性能表現上，Gemini3.1Flash-Lite 展現了令人驚歎的進化。根據權威評測平臺的數據顯示，與前代2.5Flash 相比，新模型的首字響應速度（TTFT）實現了2.5倍的爆發式增長，整體輸出速度也同步提升了45%。這種極低的延遲特性，使其能夠完美勝任需要即時反饋的對話機器人及實時處理場景。

除了“快”，這款模型還具備極高的“質價比”。谷歌爲其制定了極具競爭力的定價方案:每百萬輸入 Token 僅收0.25美元。在多項核心能力測試中，3.1Flash-Lite 甚至展現出了越級挑戰的實力，在多模態理解與邏輯推理指標上全面領先同級別競品，部分數據甚至超越了體積更大的前代模型。

此外，谷歌還在 AI Studio 和 Vertex AI 中爲該模型標配了創新的“思考層級”功能。開發者可以根據業務需求靈活調節模型的“思考深度”:對於簡單的翻譯或內容審覈，可追求極致效率;而面對複雜邏輯模擬或數據看板生成，則可激發更深層次的推理潛力。目前，該模型已通過 API 向預覽版用戶及企業級平臺同步開放，爲全球開發者構建低延遲 AI 應用提供了新利器。

劃重點:

⚡ 響應速度跨越式提升:首字響應提速2.5倍，整體速度提升45%，主打實時交互場景。
💰 極致成本控制:輸入價格低至0.25美元/百萬 Token，極大降低了大規模部署 AI 的門檻。
🧠 思考深度可控:新增“思考層級”調節功能，支持在效率與深度推理之間自由切換。

相關推薦

AI日報：GPT5.6系列模型發佈 Codex消失;騰訊擬接盤Manus成最大股東；MiniMax創始人宣佈零薪酬直至實現AGI

AI日報每日聚焦AI熱點，呈現創新產品，助開發者把握技術趨勢。本期報道：OpenAI升級Chrome擴展，ChatGPT可側邊欄常駐，支持閱讀網頁、操控標籤頁、讀寫本地文件及總結PDF，無需切換應用，僅限Plus與Pro用戶使用。

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

Meta推出旗艦大模型Muse Spark 1.1，主打多代理自動化工作流，現已通過AI聊天服務及API開放公測。該模型由負責制定計劃的主代理和按指令執行任務的子代理構成，項目啓動時主代理自動生成執行方案。

三星殺回PC芯片戰場：自研AI專用芯片GAIA已送測聯想惠普， 2027 年量產

三星電子正加速佈局AI PC芯片，其自研加速處理器代號“GAIA”計劃2027年量產。該芯片由系統LSI事業部主導，基於4nm工藝，核心圍繞NPU設計，專注生成式AI任務加速。原型已送測聯想、惠普等廠商，進入性能驗證階段。

吸金 20 億美元！MiniMax完成 160 億港元新一輪融資，獲超 7 倍超額認購

MiniMax完成160億港元（超20億美元）融資，將投入AI基礎設施、前沿模型研發與全球商業化擴張。本輪融資國際反響熱烈，最終規模超出原計劃的18億美元。

摩根大通潑冷水：AI投資熱潮降溫，市場不再"沾AI就買"

摩根大通策略師戴維·萊博維茨指出，投資者對AI的態度正從盲目追捧轉向理性甄別。隨着AI成跨資產交易主題，華爾街必須學會分辨風險與回報。市場正細緻區分產業鏈各環節，判斷供給過剩與需求強勁的領域，告別單純狂熱。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase