Google 發佈 Gemini3.1Flash-Lite:性能大幅超越前代，輸出價格上調三倍

Google DeepMind 近日正式發佈 Gemini3.1Flash-Lite 預覽版，標誌着 Gemini3系列中速度最快、性價比最高的成員面世。作爲 Gemini2.5Flash-Lite 的迭代產品，新模型在保持每秒超360個 token 的極速輸出及5.1秒平均響應時間的基礎上，實現了智能水平的顯著跨越。根據 Artificial Analysis 智能指數監測，該模型得分較前代提升12分至34分，並在 Arena.ai 排行榜中憑藉1432的 Elo 分數展現出強勁的人類偏好競爭力。

gemini

在多模態與科學推理等核心維度，Gemini3.1Flash-Lite 的表現尤爲突出，其在 GPQA Diamond 測試中取得86.9% 的高分，MMMU-Pro 基準測試準確率達76.8%，性能已超越 Claude Opus4.6與 Kimi K2.5等重型模型。值得注意的是，該模型支持開發者自定義“思考”深度，使其能夠靈活適配從簡單的自動化翻譯到複雜的 UI 構建等多樣化場景。

然而，性能與速度的雙重進化伴隨着顯著的成本調整。Gemini3.1Flash-Lite 的每百萬輸入 token 價格上調至0.25美元，輸出價格則由前代的0.40美元大幅升至1.50美元，漲幅接近三倍。

這一價格策略反映了當前模型廠商在追求極速推理與高精度邏輯平衡時的成本壓力。隨着該模型在 Google AI Studio 及 Vertex AI 開放測試，輕量化模型市場正從單純的“低價競爭”轉向“高性能邏輯下放”的新階段。

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

微軟內部AI操作系統Project Aion曝光，專爲AI PC打造。系統基於Edge與網頁輕量化技術，摒棄傳統開始菜單與桌面圖標，任務欄直喚Copilot成唯一交互入口。平臺聚焦信息流、創作與實時資訊，獨創“空間”功能可自動歸類網頁，交互邏輯徹底重構。

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

阿里巴巴內部發文，要求員工停止使用 Anthropic Claude 全系產品，包括 Sonnet、Opus、Fable 等模型及 Claude Code 等智能體工具，最後期限爲 7 月 10 日。此舉與公司年初開放 AI 使用、提供內部模型免費額度並報銷外部模型的政策形成對比，預示着其在 AI 工具策略上的收緊和向自研體系的迴歸。

Google 發佈 Gemini3.1Flash-Lite:性能大幅超越前代，輸出價格上調三倍

相關推薦

讓機器人學會番茄炒蛋的“幕後推手”：Genesis AI 開源全棧訓練場

AI 智能體 Elements Claw 成功“閉環”超導材料研發

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

微軟 AI PC 專屬系統 Project Aion 曝光，徹底取消傳統開始菜單

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具