搭配運用生成式 AI RAG 和 Cloud SQL

建構生成式 AI 即時通訊應用程式,使用檢索增強生成 (RAG) 技術,根據貴機構的資料提供準確的回覆。本指南說明「透過 Cloud SQL 採用生成式 AI RAG」應用程式範本,您可以自訂範本以符合自身需求,並部署為應用程式。

舉例來說,您可以實作這個範本,滿足下列業務需求:

範例 業務需求 導入作業
客服聊天機器人 企業必須提供即時客戶服務。 在 Cloud Run 上託管聊天介面。Vertex AI 會處理嵌入內容,並根據儲存在 Cloud SQL 中的向量技術文件生成回覆。
內部人資助理 員工需要尋找福利、公司政策和內部程序相關資訊。 在 Cloud Run 上託管 HR 助理。員工查詢工具時,Vertex AI 會從 Cloud SQL 擷取相關政策資訊,生成準確且有出處根據的回覆。
法律文件研究人員 法務團隊需要從大量文件儲存庫中,快速找出相關判例法或合約條款。 在 Cloud Run 上託管研究入口網站。Vertex AI 會摘要說明相關先例,並使用儲存在 Cloud SQL 中的法律文件 (以向量形式) 找出合約中的特定用語。
語意產品搜尋 電子商務公司希望使用者能以自然語言描述產品,而非使用確切的關鍵字。 在 Cloud Run 上託管搜尋介面。Vertex AI 會處理使用者說明,並從儲存在 Cloud SQL 的產品目錄中,傳回語意上最相關的產品。

架構

下圖顯示應用程式中的元件和連線:

設計畫布中的生成式 AI RAG 應用程式。應用程式包含前端、擷取、AI、密鑰管理和資料庫元件。

以下是應用程式的要求處理流程:

  1. 將資料載入 Cloud SQL 中的 PostgreSQL 資料庫。
  2. Vertex AI 會建立文字欄位的嵌入項目,並以向量形式儲存在資料庫中。
  3. Cloud Load Balancing 前端會接收外部要求,並將流量分配至 Cloud Load Balancing 後端。
  4. Cloud Load Balancing 後端會將流量分配至 Cloud Run 前端服務。
  5. 前端服務會針對生成式 AI 呼叫與檢索服務通訊。
  6. 擷取服務會使用 Secret Manager 安全地存取 API 金鑰和憑證,以便存取 Vertex AI 和 Cloud SQL。
  7. 擷取服務會將要求轉換為嵌入項目,並在 Cloud SQL 資料庫中搜尋類似向量。
  8. 擷取服務會將搜尋結果和原始提示傳送至 Vertex AI,藉此建立回覆。

後續步驟