Google Gemini API迎來隱式緩存功能自動節省開發成本高達75%

近期，Google 宣佈在其 Gemini API 中推出一項新功能 —— 隱式緩存。這一功能旨在幫助第三方開發者在使用最新 AI 模型時節省成本，最高可達75% 的費用節約，尤其是在處理重複性上下文時效果顯著。

隱式緩存的工作原理

隱式緩存的核心在於，它能夠自動識別並重用之前請求中相似的內容。Google 表示，這項新功能已默認開啓，適用於 Gemini2.5Pro 和2.5Flash 模型。當開發者向 Gemini2.5模型發送請求時，如果該請求與之前的某個請求存在相同的前綴，就有可能命中緩存，從而實現成本節約。

與此前的顯式緩存不同，開發者在使用隱式緩存時不再需要手動定義高頻請求。顯式緩存的方式雖然承諾了節省成本，但由於其需要大量手動配置，導致許多開發者對此頗感不滿，尤其是在最近幾周關於 API 費用過高的投訴不斷增加。

隱式緩存的優勢

隱式緩存的最大優勢在於其自動化程度。Google 在其官方博客中指出，當請求的上下文信息與先前請求相似時，系統會自動返回成本節約。這種方式簡化了開發者的操作流程，減輕了他們的負擔。

根據 Google 的開發者文檔，隱式緩存的最低提示令牌數爲2，048（針對2.5Pro 模型）和1，024(針對2.5Flash 模型)，這意味着開發者只需提供少量信息即可觸發自動節省。令牌是模型處理的數據基本單元，大約1，000個令牌相當於750個單詞。

使用建議與注意事項

爲了更好地利用隱式緩存，Google 建議開發者在請求的開頭儘量放置重複的上下文內容，以增加命中緩存的機率。而可能會在請求間變化的上下文信息，則建議放在請求的末尾。

儘管 Google 對此次隱式緩存的效果充滿信心，但尚未提供第三方驗證，因此開發者在使用過程中仍需保持謹慎。隨着越來越多的開發者開始使用這一新功能，我們期待他們的反饋能夠驗證 Google 的承諾。

總的來說，Google 的隱式緩存功能無疑爲開發者提供了一個降低成本的新選擇。在 AI 模型的使用成本持續上升的背景下，這項創新功能的推出將對開發者社區產生積極影響。未來，隨着反饋的積累，我們也將看到這一功能的實際效果。

官方博客:https://developers.googleblog.com/en/gemini-2-5-models-now-support-implicit-caching/

開源社區新添利器:DeerFlow深度研究框架融合AI與專業工具

DeerFlow，一個由社區驅動的全新深度研究框架日前發佈，旨在將語言模型與專業工具相結合，爲開源社區提供強大的自動化研究解決方案。這款基於LangGraph構建的模塊化多智能體系統，秉持"源於開源，回饋開源"的理念，爲研究人員和開發者提供了一套完整的工具鏈。DeerFlow的核心優勢在於其全面的功能整合。該框架支持多種語言模型集成，包括開源模型和兼容OpenAI API的接口，使用戶能夠靈活選擇適合自己需求的AI引擎。在工具集成方面，DeerFlow支持Tavily、Brave Search等Web搜索服務，同時具備

告別對話斷層：Mem0動態存儲技術實現AI代理記憶永續

Mem0 研究團隊近日發佈突破性內存架構，旨在解決AI系統在長期對話中的"健忘症"問題。名爲Mem0 和Mem0g的兩種新型內存系統，能讓大型語言模型(LLM)在數週甚至數月的對話中保持連貫一致性，實現更接近人類的記憶能力。傳統AI系統受限於固定上下文窗口，無法在長期交互中有效記憶關鍵信息。Mem0 首席執行官Taranjeet Singh表示："在生產環境中，傳統記憶方法很快達到極限。客服機器人可能忘記之前的退款請求，規劃助理可能記住行程但忘記座位偏好，醫療助手可能無法記住之前報告的過敏症

IBM 將三大 AI 項目移交給 Linux 基金會，推動開源 AI 發展

IBM 宣佈將三項關鍵的人工智能（AI）項目移交給 Linux 基金會的 LF AI & Data 基金會，進一步推動開源 AI 的發展。這三項新項目分別是 Docling、BeeAI 和數據準備工具包(Data Prep Kit)，反映了業界對開放和協作式 AI 開發的日益重視。與傳統的封閉式解決方案不同，這些開源工具爲開發者提供了更大的靈活性，使他們能夠根據不同的需求進行修改和適配。這些工具致力於解決 AI 開發中的關鍵挑戰，如多代理數據協調和可擴展數據準備等。IBM 已經開發了這些 AI 工具，並將其交由 Linux 基金會來管理和

成本降低88%：阿里巴巴ZeroSearch技術顛覆AI訓練模式

阿里巴巴集團研究人員近日推出一項名爲"ZeroSearch"的突破性技術，徹底改變了訓練人工智能系統搜索信息的方式。這項創新技術通過模擬方法讓大型語言模型（LLM）開發高級搜索功能，無需在訓練過程中與真實搜索引擎交互，從而消除了對昂貴商業搜索引擎API的依賴。解決成本與複雜性難題ZeroSearch解決了AI行業面臨的兩大關鍵挑戰:搜索引擎返回文檔質量的不可預測性，以及向谷歌等商業搜索引擎進行數十萬次API調用所產生的高昂成本。研究人員在本週發表於arXiv的論文中指出:"強化學習[RL

Meta任命前谷歌DeepMind主管爲AI研究實驗室新負責人

根據彭博社的報道，Meta 公司已任命 Robert Fergus 爲其基礎 AI 研究實驗室（FAIR）的新負責人，接替於四月宣佈離職的 Joelle Pineau。Fergus 在擔任 Meta 新職務之前，曾在 Google DeepMind 工作了約五年，擔任研究總監。在此之前，他還曾在 Meta 擔任研究科學家。FAIR 自2013年成立以來，一直是 Meta 在人工智能領域的重要研究機構。然而，近期的報告指出，該實驗室面臨了一些挑戰。FAIR 最初是 Meta 在人工智能領域的重要先鋒，曾主導研發了公司早期的 AI 模型，如 Llama1和 Llama2。然而，近年來，多名研究

Google Gemini API迎來隱式緩存功能 自動節省開發成本高達75%