Caso de uso da IA generativa: gerar recomendações personalizadas de produtos

Este documento descreve uma arquitetura de alto nível para usar a IA e gerar recomendações personalizadas de produtos para um aplicativo de varejo em Google Cloud.

O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA generativa na nuvem para o setor de varejo. O documento pressupõe que você tenha um entendimento básico da IA generativa.

Arquitetura

O diagrama a seguir mostra uma arquitetura que usa um modelo de IA para gerar recomendações de produtos personalizadas com base em insights de métricas de clickstream.

Arquitetura para usar a IA e gerar recomendações personalizadas de produtos. Arquitetura para usar a IA e gerar recomendações personalizadas de produtos}.

A arquitetura mostra os seguintes fluxos:

  • Ingerir e processar dados do usuário:
    1. Dados de clickstream, como visualizações de página, cliques e compras, são enviados para um pipeline do Dataflow.
    2. O Dataflow processa os dados e gera insights, como perfis e preferências de usuários. Em seguida, o Dataflow armazena os dados, insights e incorporações de vetores no BigQuery.
  • Gerar e veicular recomendações de produtos:
    1. Um cliente visita a vitrine da empresa, que é um serviço do Cloud Run nessa arquitetura.
    2. O serviço de vitrine envia os dados do visitante para um serviço de recomendação executado no Cloud Run.
    3. O serviço de recomendação realiza uma pesquisa de similaridade vetorial no BigQuery e recupera dados sobre o perfil e as preferências do visitante.
    4. O serviço de recomendação envia os dados de perfil e preferências do visitante para a API Gemini na Vertex AI com um comando para gerar recomendações de produtos. O Gemini gera recomendações de produtos personalizadas para o visitante.
    5. O serviço de recomendação envia as recomendações de produtos para o serviço de vitrine, que as mostra.

Para otimizar o custo e o desempenho, adicione um cache entre o serviço da vitrine e o serviço de recomendação. O serviço de recomendação verifica o cache em busca de dados de visitantes. Se o cache não tiver dados relevantes, o serviço vai realizar uma pesquisa de similaridade de vetores no BigQuery. Para configurar o cache, use o Memorystore ou configure um balanceador de carga com o Cloud CDN.

Produtos usados

Esta arquitetura de exemplo usa os seguintes produtos Google Cloud :

  • Cloud Run: uma plataforma de computação sem servidor que permite executar contêineres diretamente na infraestrutura escalonável do Google.
  • Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
  • BigQuery: um data warehouse corporativo que ajuda a gerenciar e analisar seus dados com recursos integrados, como análise geoespacial de machine learning e Business Intelligence.
  • Dataflow: um serviço que oferece processamento unificado de dados de stream e em lote em escala.

Implantação

Para testar aplicativos de IA generativa em Google Cloud para cargas de trabalho de varejo, use os seguintes exemplos de código:

A seguir

Colaboradores

Autor: Kumar Dhanagopal | Desenvolvedor de soluções de vários produtos

Outros colaboradores: