Gemini Enterprise Agent Platform 的 RAG Engine 總覽

本頁說明 RAG 引擎及其運作方式。

說明 遊戲主機
如要瞭解如何使用 Vertex AI SDK 在 Gemini Enterprise Agent Platform 工作上執行 RAG Engine,請參閱 Python 適用的 RAG 快速入門指南 試用 RAG Engine

總覽

RAG 引擎是 Gemini Enterprise Agent Platform 的元件,可協助執行檢索增強生成 (RAG) 作業。RAG 引擎也是一種資料框架,可用於開發以脈絡資料增強的大型語言模型 (LLM) 應用程式。將 LLM 套用至資料時,會以脈絡資料增強應用程式,實現檢索增強生成 (RAG)。

LLM 的常見問題是無法理解私人知識,也就是貴機構的資料。有了 RAG 引擎,您就能為 LLM 脈絡資料增添私人資訊,藉此減少模型幻覺並提供更準確的回覆。

結合額外知識來源與 LLM 現有的知識,提供更完善的背景資訊。改善後的脈絡和查詢可提升 LLM 回覆的品質。

下圖說明瞭解 RAG 引擎的重要概念。

Agent Platform RAG 重要概念

這些概念會依檢索增強生成 (RAG) 程序列出。

  1. 資料擷取:從不同資料來源擷取資料,例如本機檔案、Cloud Storage 和 Google 雲端硬碟。

  2. 資料轉換:轉換資料以準備建立索引。舉例來說,資料會分割成多個區塊。

  3. 嵌入: 字詞或文字片段的數值表示法。這些數字會擷取文字的語意和情境。相似或相關的字詞或文字通常會有相似的嵌入,也就是在高維度向量空間中彼此靠近。

  4. 資料索引:RAG 引擎會建立稱為「語料庫」的索引。索引會建構知識庫,以便進行最佳化搜尋。舉例來說,索引就像巨型參考書的詳細目錄。

  5. 檢索:使用者提問或提供提示時,RAG Engine 中的檢索元件會搜尋知識庫,找出與查詢相關的資訊。

  6. 生成:系統會將擷取的資訊做為脈絡,加入原始使用者查詢,引導生成式 AI 模型生成有根據的相關回覆。

支援的地區

RAG Engine 支援下列地區:

區域 位置 說明 發布階段
us-central1 愛荷華州 支援 v1v1beta1 版本。 喬治亞州阿洛威斯特
us-east4 維吉尼亞州 支援 v1v1beta1 版本。 喬治亞州阿洛威斯特
us-east1 南卡羅來納州蒙克斯科納 支援 v1v1beta1 版本。 許可清單、預覽
europe-west3 德國法蘭克福 支援 v1v1beta1 版本。 正式發布版
europe-west4 荷蘭埃姆斯港 支援 v1v1beta1 版本。 正式發布版
asia-east1 台灣 支援 v1v1beta1 版本。 預覽
asia-northeast1 東京 支援 v1v1beta1 版本。 預覽
asia-northeast3 首爾 支援 v1v1beta1 版本。 預覽
asia-south1 孟買 支援 v1v1beta1 版本。 預覽
asia-southeast1 新加坡 支援 v1v1beta1 版本。 預覽
europe-central2 華沙 支援 v1v1beta1 版本。 預覽
europe-north1 芬蘭 支援 v1v1beta1 版本。 預覽
europe-southwest1 馬德里 支援 v1v1beta1 版本。 預覽
europe-west1 比利時 支援 v1v1beta1 版本。 預覽
europe-west2 倫敦 支援 v1v1beta1 版本。 預覽
europe-west6 蘇黎世 支援 v1v1beta1 版本。 預覽
europe-west8 米蘭 支援 v1v1beta1 版本。 預覽
europe-west9 巴黎 支援 v1v1beta1 版本。 預覽
us-east5 俄亥俄州哥倫布 支援 v1v1beta1 版本。 預覽
us-south1 德州達拉斯 支援 v1v1beta1 版本。 預覽
us-west1 俄勒岡州 支援 v1v1beta1 版本。 預覽
us-west4 內華達州拉斯維加斯 支援 v1v1beta1 版本。 預覽
  • us-central1us-east1us-east4 會變更為 Allowlist。如要試用 RAG Engine,請嘗試其他區域。

刪除 RAG Engine

如要進一步瞭解如何刪除 RAG Engine,請參閱下列文章:

後續步驟