谷歌近日在其 Gemini 系列中推出了全新的 Gemini2.5Flash,這一版本正在進行預覽,旨在爲開發者提供更強大的推理能力。藉助 “思考” 過程,開發者可以根據需求靈活控制成本和延遲,打造更具性價比的解決方案。
與前一版本2.0Flash 相比,Gemini2.5Flash 的升級主要體現在推理能力上。這是谷歌首次推出的全混合推理模型,允許開發者選擇是否啓用思考功能。通過設置思考預算,開發者能夠在質量、成本和延遲之間找到理想的平衡點。即便在思考功能關閉的情況下,2.5Flash 依然保持着2.0Flash 的快速響應速度,並進一步提升了整體性能。
這一新的思考模型能在生成輸出之前,進行一系列的推理過程。這一過程幫助模型更好地理解輸入的提示,分解複雜任務,進而規劃出更爲精準的回答。例如,在處理一些需要多步驟推理的複雜任務時(如解決數學問題或分析研究問題),思考過程使得模型能夠得出更加準確和全面的答案。在 LMArena 的 “困難提示” 測試中,Gemini2.5Flash 的表現優異,僅次於2.5Pro。
Gemini2.5Flash 還帶來了對思考過程的細粒度控制,開發者可以爲模型設定一個最大思考令牌數,以靈活調整推理質量。設置較高的預算能讓模型進行更深入的思考,從而提升回答的質量,而如果預算設置爲0,模型則能在保持最低成本的同時,超越2.0Flash 的表現。
在實際應用中,不同的任務複雜度對應不同的思考需求。簡單的翻譯或計算任務可能只需少量思考,而較爲複雜的數學題或編程問題則需要更多的推理時間。通過設置思考預算,開發者可以選擇適合自己需求的推理深度,從而更有效地解決各種問題。
目前,開發者可以通過 Gemini API、Google AI Studio 和 Vertex AI 使用 Gemini2.5Flash。谷歌鼓勵大家試驗思考預算參數,探索如何通過可控的推理能力來解決更復雜的難題。