本文档介绍了使用 AI 在 Google Cloud中为零售应用生成个性化商品推荐的高级架构。
本文档的目标受众群体包括为零售行业在云端构建和管理生成式 AI 应用的架构师、开发者和管理员。本文档假定您对生成式 AI 有基本的了解。
架构
下图展示了一种架构,该架构使用 AI 模型根据点击流指标中的分析洞见生成个性化的商品推荐。
该架构展示了以下流程:
- 注入和处理用户数据:
- 将网页浏览、点击和购买等点击流数据上传到 Dataflow 流水线。
- Dataflow 会处理数据并得出用户个人资料和偏好设置等分析洞见。然后,Dataflow 会将数据、分析洞见和向量嵌入存储在 BigQuery 中。
- 生成并给出商品推荐:
- 客户访问公司的店面,在此架构中,该店面是一项 Cloud Run 服务。
- 店面服务会将访问者的数据发送到在 Cloud Run 上运行的Recommender服务。
- Recommender服务会在 BigQuery 中执行向量相似度搜索,并检索有关访问者的个人资料和偏好的数据。
- Recommender服务将访问者的个人资料和偏好设置数据发送到 Vertex AI 中的 Gemini API,并附带生成商品推荐的提示。Gemini 会生成为访问者量身定制的商品推荐。
- Recommender服务将商品推荐发送到店面服务,然后由店面服务显示推荐。
为了优化费用和性能,请在店面服务和Recommender服务之间添加缓存。Recommender服务会检查缓存中是否有访问者数据。如果缓存中不包含相关数据,该服务会在 BigQuery 中执行向量相似度搜索。如需设置缓存,您可以使用 Memorystore 或配置带有 Cloud CDN 的负载均衡器。
使用的产品
此示例架构使用以下 Google Cloud 产品:
- Cloud Run:一个无服务器计算平台,可让您直接在 Google 可伸缩的基础设施之上运行容器。
- Vertex AI:一个机器学习平台,用于训练和部署机器学习模型和 AI 应用以及自定义 LLM,以在依托 AI 技术的应用中使用。
- BigQuery:一种企业数据仓库,可帮助您使用机器学习地理空间分析和商业智能等内置功能管理和分析数据。
- Dataflow:一项服务,可大规模提供统一的流式数据处理和批量数据处理。
部署
如需在 Google Cloud 中针对零售工作负载试用生成式 AI 应用,请使用以下代码示例:
后续步骤
- 探索更多生成式 AI 架构指南。
- 如需简要了解 Google Cloud中特定于 AI 和机器学习工作负载的架构原则和建议,请参阅 Well-Architected Framework 中的 AI 和机器学习视角。
- 如需查看更多参考架构、图表和最佳实践,请浏览 Cloud 架构中心。
贡献者
作者: Kumar Dhanagopal | 跨产品解决方案开发者
其他贡献者:
- Amina Mansour | Cloud Platform 评估团队负责人
- Megan O'Keefe | 开发技术推广工程师
- Samantha He | 技术文档工程师
- Shir Meir Lador | 开发者关系工程经理