Este documento descreve uma arquitetura de alto nível para usar a IA e gerar recomendações personalizadas de produtos para um aplicativo de varejo em Google Cloud.
O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA generativa na nuvem para o setor de varejo. O documento pressupõe que você tenha um entendimento básico da IA generativa.
Arquitetura
O diagrama a seguir mostra uma arquitetura que usa um modelo de IA para gerar recomendações de produtos personalizadas com base em insights de métricas de clickstream.
A arquitetura mostra os seguintes fluxos:
- Ingerir e processar dados do usuário:
- Dados de clickstream, como visualizações de página, cliques e compras, são enviados para um pipeline do Dataflow.
- O Dataflow processa os dados e gera insights, como perfis e preferências de usuários. Em seguida, o Dataflow armazena os dados, insights e incorporações de vetores no BigQuery.
- Gerar e veicular recomendações de produtos:
- Um cliente visita a vitrine da empresa, que é um serviço do Cloud Run nessa arquitetura.
- O serviço de vitrine envia os dados do visitante para um serviço de recomendação executado no Cloud Run.
- O serviço de recomendação realiza uma pesquisa de similaridade vetorial no BigQuery e recupera dados sobre o perfil e as preferências do visitante.
- O serviço de recomendação envia os dados de perfil e preferências do visitante para a API Gemini na Vertex AI com um comando para gerar recomendações de produtos. O Gemini gera recomendações de produtos personalizadas para o visitante.
- O serviço de recomendação envia as recomendações de produtos para o serviço de vitrine, que as mostra.
Para otimizar o custo e o desempenho, adicione um cache entre o serviço da vitrine e o serviço de recomendação. O serviço de recomendação verifica o cache em busca de dados de visitantes. Se o cache não tiver dados relevantes, o serviço vai realizar uma pesquisa de similaridade de vetores no BigQuery. Para configurar o cache, use o Memorystore ou configure um balanceador de carga com o Cloud CDN.
Produtos usados
Esta arquitetura de exemplo usa os seguintes produtos Google Cloud :
- Cloud Run: uma plataforma de computação sem servidor que permite executar contêineres diretamente na infraestrutura escalonável do Google.
- Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
- BigQuery: um data warehouse corporativo que ajuda a gerenciar e analisar seus dados com recursos integrados, como análise geoespacial de machine learning e Business Intelligence.
- Dataflow: um serviço que oferece processamento unificado de dados de stream e em lote em escala.
Implantação
Para testar aplicativos de IA generativa em Google Cloud para cargas de trabalho de varejo, use os seguintes exemplos de código:
- Recomendações de varejo multimodais.
- Exemplos de código de IA generativa para casos de uso no varejo.
A seguir
- Confira mais guias de arquitetura de IA generativa.
- Para uma visão geral dos princípios e recomendações de arquitetura específicos para cargas de trabalho de IA e ML no Google Cloud, consulte a perspectiva de IA e ML no framework bem arquitetado.
- Para mais arquiteturas de referência, diagramas e práticas recomendadas, confira a Central de arquitetura do Cloud.
Colaboradores
Autor: Kumar Dhanagopal | Desenvolvedor de soluções de vários produtos
Outros colaboradores:
- Amina Mansour | Líder da equipe de avaliações do Cloud Platform
- Megan O'Keefe | Mediadora de desenvolvedores
- Samantha He | Redatora técnica
- Shir Meir Lador | Gerente de engenharia de relações com desenvolvedores