Este documento descreve uma arquitetura de alto nível para usar a IA para gerar recomendações de produtos personalizadas para uma aplicação de retalho em Google Cloud.
O público-alvo deste documento inclui arquitetos, programadores e administradores que criam e gerem aplicações de IA generativa na nuvem para a indústria de retalho. O documento pressupõe que tem uma compreensão básica da IA generativa.
Arquitetura
O diagrama seguinte mostra uma arquitetura que usa um modelo de IA para gerar recomendações de produtos personalizadas com base em estatísticas de métricas de fluxo de cliques.
A arquitetura mostra os seguintes fluxos:
- Carregar e processar dados do utilizador:
- Os dados de fluxo de cliques, como visualizações de páginas, cliques e compras, são carregados para um pipeline do Dataflow.
- O fluxo de dados processa os dados e deriva estatísticas, como perfis e preferências dos utilizadores. Em seguida, o Dataflow armazena os dados, as estatísticas e as incorporações de vetores no BigQuery.
- Gere e publique recomendações de produtos:
- Um cliente visita a montra da empresa, que é um serviço do Cloud Run nesta arquitetura.
- O serviço de montra envia os dados do visitante para um serviço de recomendações que é executado no Cloud Run.
- O serviço de recomendações realiza uma pesquisa de semelhança vetorial no BigQuery e obtém dados sobre o perfil e as preferências do visitante.
- O serviço de recomendações envia os dados do perfil e das preferências do visitante para a API Gemini na Vertex AI, com um comando para gerar recomendações de produtos. O Gemini gera recomendações de produtos personalizadas para o visitante.
- O serviço de recomendações envia as recomendações de produtos para o serviço de loja, que, em seguida, apresenta as recomendações.
Para otimizar o custo e o desempenho, adicione uma cache entre o serviço de montra e o serviço de recomendações. O serviço de recomendações verifica a cache para obter dados dos visitantes. Se a cache não contiver dados relevantes, o serviço realiza uma pesquisa de similaridade de vetores no BigQuery. Para configurar a cache, pode usar o Memorystore ou configurar um equilibrador de carga com o Cloud CDN.
Produtos usados
Esta arquitetura de exemplo usa os seguintes Google Cloud produtos:
- Cloud Run: uma plataforma de computação sem servidor que lhe permite executar contentores diretamente na infraestrutura escalável da Google.
- Vertex AI: uma plataforma de ML que lhe permite preparar e implementar modelos de ML e aplicações de IA, bem como personalizar MDIs/CEs para utilização em aplicações com tecnologia de IA.
- BigQuery: um armazém de dados empresariais que ajuda a gerir e analisar os seus dados com funcionalidades integradas, como aprendizagem automática, análise geoespacial e Business Intelligence.
- Dataflow: um serviço que oferece processamento de dados por streaming e em lote unificado em grande escala.
Implementação
Para experimentar aplicações de IA generativa em Google Cloud para cargas de trabalho de retalho, use os seguintes exemplos de código:
- Recomendações de retalho multimodais.
- Exemplos de código de IA generativa para exemplos de utilização no setor de retalho.
O que se segue?
- Explore mais guias de arquitetura de IA generativa.
- Para uma vista geral dos princípios arquitetónicos e das recomendações específicos das cargas de trabalho de IA e ML no Google Cloud, consulte aperspetiva de IA e ML no Framework Well-Architected.
- Para ver mais arquiteturas de referência, diagramas e práticas recomendadas, explore o Centro de arquitetura na nuvem.
Colaboradores
Autor: Kumar Dhanagopal | Cross-Product Solution Developer
Outros colaboradores:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Megan O'Keefe | Consultora de programadores
- Samantha He | Redator técnico
- Shir Meir Lador | Developer Relations Engineering Manager