Google 今日正式推出 Gemini API 中的“文件搜索工具”(File Search Tool),一款完全託管的 RAG 系統。該工具將私有文件無縫轉化爲 Gemini 的知識庫,用戶無需自行處理數據分塊、嵌入生成或向量存儲等繁瑣步驟,直接通過 API 集成即可實現高效檢索與生成。

工具核心功能:一站式 RAG 流程打包文件
搜索工具的核心在於其端到端的集成設計。它自動處理文件上傳、索引和檢索過程,利用 Google 的 Gemini Embedding 模型(gemini-embedding-001)生成高質量向量表示,支持語義搜索而非簡單關鍵詞匹配。這意味着開發者可以專注於應用邏輯,而非底層基礎設施維護。
據 Google 官方博客介紹,該工具支持多種常見文件格式,包括 PDF、DOCX、TXT、JSON,以及各種編程語言文件(如 Python、Java 等源代碼)。用戶只需通過 Gemini API 的 generateContent 接口調用,即可將私有文檔導入知識庫。系統會智能分塊數據,確保檢索結果的上下文連貫性,並在響應中自動生成引用鏈接,直接指向文檔的具體部分,從而提升輸出的透明度和可驗證性。
這一設計特別適用於企業級場景,例如內部知識助手、智能支持機器人或內容發現平臺。Google 強調,對於海量數據、頻繁更新、重複查詢或需要嚴格可追溯性的應用,該工具能顯著降低開發門檻,並提供可擴展的性能支持。
創新計費模式:查詢免費,首次索引低至0.15美元/百萬詞元
與傳統 RAG 解決方案不同,文件搜索工具採用全新的計費範式:查詢期間的存儲和嵌入生成完全免費,僅在首次索引文件時收取嵌入生成費用。該費用基於詞元(token)計算,使用 gemini-embedding-001模型的標準率爲每百萬詞元0.15美元。這使得工具在成本控制上更具競爭力,尤其適合大規模部署和實驗性項目。Google 產品經理在公告中指出:“這一計費模式大幅降低了 RAG 實現的入門門檻和運營成本,幫助開發者更快地將 AI 落地。” 後續文件更新或增量索引將僅按實際變化部分計費,進一步優化了資源利用效率。
