Exemplo de utilização da IA generativa: gerar recomendações de produtos personalizadas

Este documento descreve uma arquitetura de alto nível para usar a IA para gerar recomendações de produtos personalizadas para uma aplicação de retalho em Google Cloud.

O público-alvo deste documento inclui arquitetos, programadores e administradores que criam e gerem aplicações de IA generativa na nuvem para a indústria de retalho. O documento pressupõe que tem uma compreensão básica da IA generativa.

Arquitetura

O diagrama seguinte mostra uma arquitetura que usa um modelo de IA para gerar recomendações de produtos personalizadas com base em estatísticas de métricas de fluxo de cliques.

Arquitetura para usar a IA para gerar recomendações de produtos personalizadas. Arquitetura para usar a IA para gerar recomendações de produtos personalizadas}.

A arquitetura mostra os seguintes fluxos:

  • Carregar e processar dados do utilizador:
    1. Os dados de fluxo de cliques, como visualizações de páginas, cliques e compras, são carregados para um pipeline do Dataflow.
    2. O fluxo de dados processa os dados e deriva estatísticas, como perfis e preferências dos utilizadores. Em seguida, o Dataflow armazena os dados, as estatísticas e as incorporações de vetores no BigQuery.
  • Gere e publique recomendações de produtos:
    1. Um cliente visita a montra da empresa, que é um serviço do Cloud Run nesta arquitetura.
    2. O serviço de montra envia os dados do visitante para um serviço de recomendações que é executado no Cloud Run.
    3. O serviço de recomendações realiza uma pesquisa de semelhança vetorial no BigQuery e obtém dados sobre o perfil e as preferências do visitante.
    4. O serviço de recomendações envia os dados do perfil e das preferências do visitante para a API Gemini na Vertex AI, com um comando para gerar recomendações de produtos. O Gemini gera recomendações de produtos personalizadas para o visitante.
    5. O serviço de recomendações envia as recomendações de produtos para o serviço de loja, que, em seguida, apresenta as recomendações.

Para otimizar o custo e o desempenho, adicione uma cache entre o serviço de montra e o serviço de recomendações. O serviço de recomendações verifica a cache para obter dados dos visitantes. Se a cache não contiver dados relevantes, o serviço realiza uma pesquisa de similaridade de vetores no BigQuery. Para configurar a cache, pode usar o Memorystore ou configurar um equilibrador de carga com o Cloud CDN.

Produtos usados

Esta arquitetura de exemplo usa os seguintes Google Cloud produtos:

  • Cloud Run: uma plataforma de computação sem servidor que lhe permite executar contentores diretamente na infraestrutura escalável da Google.
  • Vertex AI: uma plataforma de ML que lhe permite preparar e implementar modelos de ML e aplicações de IA, bem como personalizar MDIs/CEs para utilização em aplicações com tecnologia de IA.
  • BigQuery: um armazém de dados empresariais que ajuda a gerir e analisar os seus dados com funcionalidades integradas, como aprendizagem automática, análise geoespacial e Business Intelligence.
  • Dataflow: um serviço que oferece processamento de dados por streaming e em lote unificado em grande escala.

Implementação

Para experimentar aplicações de IA generativa em Google Cloud para cargas de trabalho de retalho, use os seguintes exemplos de código:

O que se segue?

Colaboradores

Autor: Kumar Dhanagopal | Cross-Product Solution Developer

Outros colaboradores: