Vertex AI RAG 引擎簡介

本頁說明 Vertex AI RAG 引擎的用途和運作方式。

說明 遊戲主機
如要瞭解如何使用 Vertex AI SDK 執行 Vertex AI RAG Engine 工作,請參閱 Python 適用的 RAG 快速入門導覽課程

試用 Vertex AI RAG 引擎

總覽

Vertex AI RAG 引擎是 Vertex AI 平台的一項元件,可協助您執行檢索增強生成 (RAG)。Vertex AI RAG Engine 也是一種資料架構,可用於開發具備脈絡資料增強功能的大型語言模型 (LLM) 應用程式。將 LLM 套用至資料時,系統會增強脈絡資料,進而實作檢索增強生成 (RAG)。

LLM 的常見問題是不瞭解私人知識,也就是貴機構的資料。有了 Vertex AI RAG Engine,您就能為 LLM 脈絡資料增添私人資訊,因為模型可減少幻覺並提供更準確的回覆。

結合額外的知識來源與 LLM 現有的知識,可提供更完善的背景資訊。改善後的脈絡和查詢可提升 LLM 回覆的品質。

下圖說明瞭解 Vertex AI RAG Engine 的重要概念。

Vertex AI RAG 重要概念

這些概念會依檢索增強生成 (RAG) 流程列出。

  1. 資料擷取:從不同資料來源擷取資料。例如本機檔案、Cloud Storage 和 Google 雲端硬碟。

  2. 資料轉換: 轉換資料,準備建立索引。例如,資料會分割成多個區塊。

  3. 嵌入:以數值表示字詞或文字片段,這些數字會擷取文字的語意和背景資訊。相似或相關的字詞或文字通常會有相似的嵌入,也就是在高維度向量空間中彼此更靠近。

  4. 資料建立索引:Vertex AI RAG 引擎會建立名為「語料庫」的索引。 索引會建構知識庫,以便進行最佳化搜尋。舉例來說,索引就像是巨型參考書的詳細目錄。

  5. 擷取:當使用者提出問題或提供提示時,Vertex AI RAG Engine 中的擷取元件會搜尋知識庫,找出與查詢相關的資訊。

  6. 生成:擷取的資訊會成為加入原始使用者查詢的脈絡,引導生成式 AI 模型生成有根據且相關的回覆。

支援的地區

Vertex AI RAG 引擎支援下列區域:

區域 位置 說明 發布階段
us-central1 愛荷華州 支援 v1v1beta1 版本。 許可清單
us-east4 維吉尼亞州 支援 v1v1beta1 版本。 許可清單
europe-west3 德國法蘭克福 支援 v1v1beta1 版本。 正式發布版
europe-west4 荷蘭埃姆斯港 支援 v1v1beta1 版本。 正式發布版
asia-east1 台灣 支援 v1v1beta1 版本。 預覽
asia-northeast1 東京 支援 v1v1beta1 版本。 預覽
asia-northeast3 首爾 支援 v1v1beta1 版本。 預覽
asia-south1 孟買 支援 v1v1beta1 版本。 預覽
asia-southeast1 新加坡 支援 v1v1beta1 版本。 預覽
europe-central2 華沙 支援 v1v1beta1 版本。 預覽
europe-north1 芬蘭 支援 v1v1beta1 版本。 預覽
europe-southwest1 馬德里 支援 v1v1beta1 版本。 預覽
europe-west1 比利時 支援 v1v1beta1 版本。 預覽
europe-west2 倫敦 支援 v1v1beta1 版本。 預覽
europe-west6 蘇黎世 支援 v1v1beta1 版本。 預覽
europe-west8 米蘭 支援 v1v1beta1 版本。 預覽
europe-west9 巴黎 支援 v1v1beta1 版本。 預覽
us-east1 南卡羅來納州蒙克斯科納 支援 v1v1beta1 版本。 預覽
us-east5 俄亥俄州哥倫布 支援 v1v1beta1 版本。 預覽
us-south1 德州達拉斯 支援 v1v1beta1 版本。 預覽
us-west1 奧勒岡州 支援 v1v1beta1 版本。 預覽
us-west4 內華達州拉斯維加斯 支援 v1v1beta1 版本。 預覽
  • us-central1us-east4 已變更為 Allowlist。如要試用 Vertex AI RAG Engine,請嘗試其他區域。如果您打算將正式版流量導入這些區域,請與 vertex-ai-rag-engine-support@google.com 聯絡。

刪除 Vertex AI RAG 引擎

下列程式碼範例說明如何透過 Google Cloud 控制台、Python 和 REST 刪除 Vertex AI RAG 引擎:

提交意見回饋

如要與 Google 支援團隊聯絡,請前往 Vertex AI RAG Engine 支援群組

如要傳送電子郵件,請使用電子郵件地址 vertex-ai-rag-engine-support@google.com

後續步驟