构建一个生成式 AI 聊天应用,该应用使用检索增强生成 (RAG) 技术,根据组织的数据提供有依据且准确的回答。本指南介绍了 生成式 AI RAG with Cloud SQL 应用模板,您可以根据自己的独特需求自定义该模板,并将其部署为应用。
例如,您可以实现此模板来满足以下业务需求:
| 示例 | 业务需求 | 实现 |
|---|---|---|
| 客户支持聊天机器人 | 公司需要提供即时客户支持。 | 在 Cloud Run 上托管聊天界面。Vertex AI 会处理嵌入内容,并根据以向量形式存储在 Cloud SQL 中的技术文档生成回答。 |
| 内部人力资源助理 | 员工需要查找有关福利、公司政策和内部程序的信息。 | 在 Cloud Run 上托管 HR 助理。当员工向该工具提出查询时,Vertex AI 会从 Cloud SQL 中检索相关政策信息,以生成准确且有来源依据的回答。 |
| 法律文件研究人员 | 法律团队需要快速在大型文档库中找到相关的判例法或合同条款。 | 在 Cloud Run 上托管研究门户。Vertex AI 会总结相关先例,并使用存储在 Cloud SQL 中的法律文件(以向量形式)识别合同中的特定措辞。 |
| 语义商品搜索 | 电子商务公司希望能够使用自然语言描述(而非确切的关键字)来促进产品搜索。 | 在 Cloud Run 上托管搜索界面。Vertex AI 会处理用户说明,以从 Cloud SQL 中以向量形式存储的商品目录中返回语义相关性最高的商品。 |
架构
下图显示了应用中的组件和连接:
以下是应用的请求处理流程:
- 将数据加载到 Cloud SQL 中的 PostgreSQL 数据库。
- Vertex AI 会创建文本字段的嵌入,并以向量形式将其存储在数据库中。
- Cloud Load Balancing 前端接收外部请求并将流量分配到 Cloud Load Balancing 后端。
- Cloud Load Balancing 后端将流量分配给 Cloud Run 前端服务。
- 前端服务与检索服务通信,以进行生成式 AI 调用。
- 检索服务使用 Secret Manager 安全地访问访问 Vertex AI 和 Cloud SQL 所需的 API 密钥和凭证。
- 检索服务将请求转换为嵌入,并在 Cloud SQL 数据库中搜索相似的向量。
- 检索服务会将搜索结果与初始提示一并发送至 Vertex AI,以创建回答。
后续步骤
- 了解如何部署或复制此模板。
- 了解如何自定义模板以满足您的特定需求。
- 在Google Cloud 架构框架中确定一般架构最佳实践。