Este documento fornece uma arquitetura de alto nível para um aplicativo que usa IA para gerar soluções para dúvidas de suporte dos clientes.
O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA generativa na nuvem. O documento pressupõe que você tenha um entendimento básico da IA generativa.
A seção Implantação deste documento fornece exemplos de código para casos de uso de suporte ao cliente com assistência de IA.
Arquitetura
O diagrama a seguir mostra uma arquitetura para um aplicativo de suporte técnico assistido por IA em Google Cloud. O aplicativo recebe perguntas dos clientes, recupera recursos relevantes de uma base de conhecimento e gera soluções para as dúvidas. A arquitetura é uma implementação da abordagem de geração aumentada por recuperação (RAG).
O aplicativo nesta arquitetura consiste em serviços em contêineres que são implantados em um cluster do Google Kubernetes Engine (GKE). A arquitetura mostra o seguinte fluxo:
- Um cliente envia uma pergunta para o aplicativo da central de suporte.
- O aplicativo da mesa de suporte passa a pergunta do cliente para o serviço de recuperação de conhecimento.
- O serviço de recuperação de conhecimento cria e envia um comando para a API Gemini na Vertex AI para recuperar recursos relevantes para a pergunta do cliente.
- O Gemini identifica recursos relevantes de uma base de conhecimento de suporte armazenada no Cloud Storage.
- O Gemini retorna os IDs dos recursos relevantes para o serviço de recuperação de conhecimento.
- O serviço de recuperação de conhecimento recupera os recursos relevantes do Cloud Storage.
- O serviço de recuperação de conhecimento envia a pergunta do cliente e os recursos relevantes ao serviço de geração de soluções.
- O serviço de geração de soluções envia os recursos para a API Gemini na Vertex AI, com um comando para gerar uma solução detalhada para a dúvida do cliente.
- O Gemini gera uma solução, como instruções detalhadas ou um tutorial em vídeo.
- O serviço de geração de soluções fornece a solução ao cliente pelo aplicativo da mesa de suporte.
Produtos usados
Esta arquitetura de exemplo usa os seguintes produtos Google Cloud :
- Google Kubernetes Engine (GKE): um serviço do Kubernetes que pode ser usado para implantar e operar aplicativos conteinerizados em escala usando a infraestrutura do Google.
- Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
- Cloud Storage: um armazenamento de objetos de baixo custo e sem limite para diversos tipos de dados. Os dados podem ser acessados de dentro e fora Google Cloude são replicados entre locais para redundância.
Implantação
Para testar aplicativos de suporte ao cliente com tecnologia de IA em Google Cloud, use os exemplos de código a seguir:
- Crie um aplicativo de suporte ao cliente que use a IA generativa.
- Exemplo de comando para casos de uso de atendimento ao cliente com assistência de IA.
A seguir
- Criar um agente de suporte ao cliente usando o Gemini.
- Crie agentes de IA para casos de uso de suporte ao cliente usando playbooks, fluxos e repositórios de dados no Dialogflow CX.
- Confira mais guias de arquitetura de IA generativa.
- Para uma visão geral dos princípios e recomendações de arquitetura específicos para cargas de trabalho de IA e ML no Google Cloud, consulte a perspectiva de IA e ML no framework bem arquitetado.
- Para mais arquiteturas de referência, diagramas e práticas recomendadas, confira a Central de arquitetura do Cloud.
Colaboradores
Autor: Kumar Dhanagopal | Desenvolvedor de soluções de vários produtos
Outros colaboradores:
- Amina Mansour | Líder da equipe de avaliações do Cloud Platform
- Megan O'Keefe | Mediadora de desenvolvedores
- Samantha He | Redatora técnica
- Shir Meir Lador | Gerente de engenharia de relações com desenvolvedores