來自谷歌深度學習團隊的最新消息,他們正式推出了 EmbeddingGemma,這是一款專爲移動設備設計的開源嵌入模型。EmbeddingGemma 以其308百萬個參數的高效設計,在 MTEB(大規模文本嵌入基準)中被評爲500M 以下的最佳多語言文本嵌入模型,展現出強大的功能,如檢索增強生成(RAG)和語義搜索,能夠在沒有互聯網連接的情況下直接在手機等設備上運行。

image.png

EmbeddingGemma 的優越性在於,它的性能可與幾乎是它兩倍大小的熱門模型相媲美。它不僅小巧而且靈活,適用於多種場景,支持768到128的可定製輸出維度,並擁有2000個上下文令牌窗口,能夠在手機、筆記本電腦和桌面等日常設備上運行。此外,它還與多種流行工具集成,用戶可以方便地與 sentence-transformers、MLX、Ollama 等工具合作。

EmbeddingGemma 在建立 RAG 管道時表現出色,能夠生成文本的嵌入,即將文本轉換爲數字表示,以高維空間表示其意義。在 RAG 管道中,首先根據用戶輸入生成嵌入,並計算其與系統中所有文檔嵌入的相似度,從而檢索到最相關的文段。這種高質量的嵌入能夠確保最終生成的回答準確且上下文相關。

此外,EmbeddingGemma 在速度和資源消耗方面也經過精心設計,具有小巧、快速和高效的特點。其嵌入推理時間低於15毫秒,允許實時交互。它的離線功能確保了用戶數據的隱私安全,特別適合於開發基於移動設備的應用程序。

開發者們現在可以利用 EmbeddingGemma 實現個性化的聊天機器人,進行文件搜索,或爲特定領域進行快速微調。無論是在線下應用,還是需要高效性能的服務器端應用,EmbeddingGemma 都提供了理想的選擇。

官方博客:https://developers.googleblog.com/en/introducing-embeddinggemma/

劃重點:

🌟 EmbeddingGemma 是一款308M 參數的開源嵌入模型,專爲移動設備設計,能夠在無網絡情況下運行。  

📱 它支持多種工具集成,靈活適應各種應用場景,滿足開發者的需求。  

🔒 強大的離線功能確保用戶數據安全,提升隱私保護,爲移動端應用提供了可靠支持。