谷歌推出 Vertex AI RAG 引擎，助力開發者構建智能應用

谷歌最近正式推出了 Vertex AI RAG 引擎，這是一款旨在簡化從知識庫中檢索相關信息並將其輸入大型語言模型（LLM）的複雜流程的開發工具。作爲 Vertex AI 平臺的一部分，Vertex AI RAG 引擎被定義爲一種託管的編排服務和數據框架，專爲開發上下文增強的 LLM 應用而設計。

谷歌，google

在1月15日的博客中，谷歌提到，儘管生成式人工智能和大型語言模型正在變革各行各業，但仍然存在一些挑戰，例如虛假信息（生成不準確或無意義的信息）和超出訓練數據的知識侷限性，這些都可能阻礙企業的採納。而 Vertex AI RAG 引擎則通過實現檢索增強生成(RAG)技術，幫助軟件和人工智能開發者構建有根據的生成式人工智能解決方案。

谷歌強調了 Vertex AI RAG 引擎的幾個關鍵優勢。首先，它的使用非常簡便，開發者可以通過 API 迅速入手，進行原型設計和實驗。

其次，RAG 引擎提供了託管的編排功能，能夠有效處理數據檢索和 LLM 集成。此外，開發者還可以根據需求選擇解析、分塊、註釋、嵌入、向量存儲以及開源模型等組件，甚至可以自定義自己的組件，展現了極大的靈活性。

另外，Vertex AI RAG 引擎也支持多種向量數據庫的連接，例如 Pinecone 和 Weaviate，或者直接使用 Vertex AI 搜索。

谷歌在博客中提到，該引擎在金融服務、醫療和法律等行業的應用案例，顯示了其廣泛的適用性。同時，谷歌也提供了豐富的資源，包括入門筆記、與 Vertex AI 向量搜索、Vertex AI 特徵庫、Pinecone 和 Weaviate 的示例集成，以及檢索超參數調優的指南，幫助開發者更好地掌握和應用這款新工具。

美國修訂隱私法案:擬十年撥款10億禁止AI公司出售健康數據

美參議員沃倫和衆議員斯坎倫提出修訂版《健康與位置數據保護法案》，將生成式AI納入監管，禁止AI公司及數據經紀商出售用戶輸入的敏感醫療與健康信息。該立法直指科技巨頭進軍醫療領域帶來的隱私風險，源於馬斯克等公開呼籲用戶上傳核磁共振等數據所引發的擔憂。

算力告急：谷歌限制 Gemini 模型調用，Meta 研發進度受阻

在生成式人工智能浪潮推動下，算力成爲科技巨頭角逐的關鍵資源。谷歌的Gemini AI平臺因需求激增，自2025年春季以來API調用請求量翻倍，導致核心算力捉襟見肘，被迫收緊資源分配。爲平衡開發者和企業的激增負載，並保障生態系統公平，谷歌於2026年5月17日正式實施基於算力額度的使用限制，採用類似流量套餐的分級模式。這一舉措不僅緩解了供應壓力，也折射出整個AI領域對算力需求的失控性增長。

谷歌推出 Vertex AI RAG 引擎，助力開發者構建智能應用

相關推薦

美國修訂隱私法案:擬十年撥款10億禁止AI公司出售健康數據

告別“長文本焦慮”：小紅書 RedKnot 推理引擎開源，長上下文處理效率翻倍

算力告急：谷歌限制 Gemini 模型調用，Meta 研發進度受阻

挪威宣佈出臺限制政策:原則上禁止6至13歲小學生使用生成式AI

貝索斯豪擲 4 億美元領投，英國AI獨角獸CuspAI估值飆升至 26 億美元

谷歌推出 Vertex AI RAG 引擎，助力開發者構建智能應用

相關推薦

美國修訂隱私法案:擬十年撥款10億禁止AI公司出售健康數據

告別“長文本焦慮”：小紅書 RedKnot 推理引擎開源，長上下文處理效率翻倍

算力告急：谷歌限制 Gemini 模型調用，Meta 研發進度受阻

挪威宣佈出臺限制政策:原則上禁止6至13歲小學生使用生成式AI

​貝索斯豪擲 4 億美元領投，英國AI獨角獸CuspAI估值飆升至 26 億美元

貝索斯豪擲 4 億美元領投，英國AI獨角獸CuspAI估值飆升至 26 億美元