建構生成式 AI 即時通訊應用程式,使用檢索增強生成 (RAG) 技術,根據貴機構的資料提供準確的回覆。本指南說明「透過 Cloud SQL 採用生成式 AI RAG」應用程式範本,您可以自訂範本以符合自身需求,並部署為應用程式。
舉例來說,您可以實作這個範本,滿足下列業務需求:
| 範例 | 業務需求 | 導入作業 |
|---|---|---|
| 客服聊天機器人 | 企業必須提供即時客戶服務。 | 在 Cloud Run 上託管聊天介面。Vertex AI 會處理嵌入內容,並根據儲存在 Cloud SQL 中的向量技術文件生成回覆。 |
| 內部人資助理 | 員工需要尋找福利、公司政策和內部程序相關資訊。 | 在 Cloud Run 上託管 HR 助理。員工查詢工具時,Vertex AI 會從 Cloud SQL 擷取相關政策資訊,生成準確且有出處根據的回覆。 |
| 法律文件研究人員 | 法務團隊需要從大量文件儲存庫中,快速找出相關判例法或合約條款。 | 在 Cloud Run 上託管研究入口網站。Vertex AI 會摘要說明相關先例,並使用儲存在 Cloud SQL 中的法律文件 (以向量形式) 找出合約中的特定用語。 |
| 語意產品搜尋 | 電子商務公司希望使用者能以自然語言描述產品,而非使用確切的關鍵字。 | 在 Cloud Run 上託管搜尋介面。Vertex AI 會處理使用者說明,並從儲存在 Cloud SQL 的產品目錄中,傳回語意上最相關的產品。 |
架構
下圖顯示應用程式中的元件和連線:
以下是應用程式的要求處理流程:
- 將資料載入 Cloud SQL 中的 PostgreSQL 資料庫。
- Vertex AI 會建立文字欄位的嵌入項目,並以向量形式儲存在資料庫中。
- Cloud Load Balancing 前端會接收外部要求,並將流量分配至 Cloud Load Balancing 後端。
- Cloud Load Balancing 後端會將流量分配至 Cloud Run 前端服務。
- 前端服務會針對生成式 AI 呼叫與檢索服務通訊。
- 擷取服務會使用 Secret Manager 安全地存取 API 金鑰和憑證,以便存取 Vertex AI 和 Cloud SQL。
- 擷取服務會將要求轉換為嵌入項目,並在 Cloud SQL 資料庫中搜尋類似向量。
- 擷取服務會將搜尋結果和原始提示傳送至 Vertex AI,藉此建立回覆。
後續步驟
- 瞭解如何部署或複製這個範本。
- 瞭解如何自訂範本,以符合特定需求。
- 在Google Cloud 架構中找出一般架構最佳做法。