谷歌公司今天正式推出了 Gemini2.5Flash-Lite,這是其系列中最輕量化、最具成本效益的 AI 模型。隨着科技的快速發展,AI 的應用已經深入到編碼、翻譯和推理等多個領域。Gemini2.5系列的發佈,標誌着谷歌在推理速度和經濟性方面取得了新的突破。

Gemini2.5Flash 和 Flash-Lite 模型已經經過大規模的測試,現已進入穩定階段。這意味着開發者可以更放心地將其應用於生產環境中。目前,衆多知名公司如 Spline 和 Snap 等,已經在實際項目中應用了這兩款新模型,取得了良好的效果。

image.png

谷歌在此次發佈中強調,Gemini2.5系列的設計理念在於實現 “成本、速度與性能” 的完美平衡。Flash-Lite 的推理速度明顯提升,延遲大幅降低,特別適合實時翻譯和高吞吐量的分類任務。與前代2.0版本相比,Flash-Lite 在編碼、科學計算和多模態分析等方面的綜合表現都得到了顯著提升。

這款模型不僅保留了 Gemini2.5系列的核心能力,如靈活控制推理預算、連接外部工具(如谷歌搜索、代碼執行),還支持處理超長上下文,達到100萬 token 的處理能力。這一特性讓開發者在構建複雜系統時能夠更遊刃有餘。

開發者現在可以通過 Google AI Studio 和 Vertex AI 平臺,訪問到 Gemini2.5Flash、Pro 的穩定版本,以及 Flash-Lite 的預覽版本。此外,Gemini 的應用端也已集成了這兩款新模型,谷歌搜索也同步部署了定製版本,以提升用戶服務的效率。

在人工智能迅猛發展的今天,Gemini2.5Flash-Lite 無疑爲各類開發者提供了更高效、更經濟的 AI 工具,爲未來的 AI 應用打下了堅實的基礎。