谷歌最近正式推出了 Vertex AI RAG 引擎,這是一款旨在簡化從知識庫中檢索相關信息並將其輸入大型語言模型(LLM)的複雜流程的開發工具。作爲 Vertex AI 平臺的一部分,Vertex AI RAG 引擎被定義爲一種託管的編排服務和數據框架,專爲開發上下文增強的 LLM 應用而設計。

谷歌,google

在1月15日的博客中,谷歌提到,儘管生成式人工智能和大型語言模型正在變革各行各業,但仍然存在一些挑戰,例如虛假信息(生成不準確或無意義的信息)和超出訓練數據的知識侷限性,這些都可能阻礙企業的採納。而 Vertex AI RAG 引擎則通過實現檢索增強生成(RAG)技術,幫助軟件和人工智能開發者構建有根據的生成式人工智能解決方案。

谷歌強調了 Vertex AI RAG 引擎的幾個關鍵優勢。首先,它的使用非常簡便,開發者可以通過 API 迅速入手,進行原型設計和實驗。

其次,RAG 引擎提供了託管的編排功能,能夠有效處理數據檢索和 LLM 集成。此外,開發者還可以根據需求選擇解析、分塊、註釋、嵌入、向量存儲以及開源模型等組件,甚至可以自定義自己的組件,展現了極大的靈活性。

另外,Vertex AI RAG 引擎也支持多種向量數據庫的連接,例如 Pinecone 和 Weaviate,或者直接使用 Vertex AI 搜索。

谷歌在博客中提到,該引擎在金融服務、醫療和法律等行業的應用案例,顯示了其廣泛的適用性。同時,谷歌也提供了豐富的資源,包括入門筆記、與 Vertex AI 向量搜索、Vertex AI 特徵庫、Pinecone 和 Weaviate 的示例集成,以及檢索超參數調優的指南,幫助開發者更好地掌握和應用這款新工具。