本指南可協助您瞭解 Generative AI RAG with Cloud SQL 範本,這是 Google 提供的即時通訊應用程式範本。這個範本會示範如何建立使用檢索增強生成 (RAG) 技術的即時通訊應用程式。使用者在應用程式中提問時,系統會根據資料庫中以向量形式儲存的資訊提供回覆。
使用的產品
應用程式包含下列 Google Cloud 產品:
- Cloud Load Balancing (選用):這項服務可在 Google Cloud上提供高效能、可擴充的負載平衡。
- Vertex AI:機器學習 (ML) 平台,可讓您訓練及部署 ML 模型和 AI 應用程式,並自訂 LLM 用於應用程式。
- Cloud SQL:以雲端為基礎的服務,適用於 MySQL、PostgreSQL 和 SQL Server 資料庫,在Google Cloud 基礎架構上提供全代管服務。
- Cloud Run:全代管服務,可讓您建構及部署無伺服器容器化應用程式。Google Cloud 會處理資源調度和其他基礎架構工作。
- Secret Manager:安全又便利的儲存系統,可以儲存 API 金鑰、密碼、憑證和其他機密資料。
架構
下圖顯示應用程式中的元件和連線:
以下是應用程式的要求處理流程:
- 將資料載入 Cloud SQL 中的 PostgreSQL 資料庫。
- Vertex AI 會建立文字欄位的嵌入項目,並儲存為向量。
- Cloud Load Balancing 前端會接收外部要求,並將流量分配給 Cloud Load Balancing 後端。
- Cloud Load Balancing 後端會將流量分配至 Cloud Run 前端服務。
- 前端服務會針對生成式 AI 呼叫與檢索服務通訊。
- 後端服務會將要求轉換為嵌入項目,並搜尋現有嵌入項目。
- 擷取服務會將原始提示和嵌入項目搜尋作業產生的自然語言內容傳送至 Vertex AI,藉此建立回應。
後續步驟
- 瞭解如何尋找及使用其他 Google 提供的範本。
- 瞭解如何自訂範本,以符合特定需求。
- 在Google Cloud 架構架構中找出一般架構最佳做法。