Este documento fornece uma arquitetura de alto nível para uma aplicação que usa IA para gerar soluções para perguntas de apoio técnico dos clientes.
O público-alvo deste documento inclui arquitetos, programadores e administradores que criam e gerem aplicações de IA generativa na nuvem. O documento pressupõe que tem uma compreensão básica da IA generativa.
A secção Implementação deste documento fornece exemplos de código para exemplos de utilização do apoio ao cliente assistido por IA.
Arquitetura
O diagrama seguinte mostra uma arquitetura para uma aplicação de mesa de ajuda assistida por IA em Google Cloud. A aplicação recebe perguntas dos clientes, obtém recursos relevantes de uma base de conhecimentos e, em seguida, gera soluções para as perguntas. A arquitetura é uma implementação da abordagem de geração aumentada de recuperação (RAG).
A aplicação nesta arquitetura consiste em serviços contentorizados que são implementados num cluster do Google Kubernetes Engine (GKE). A arquitetura mostra o seguinte fluxo:
- Um cliente envia uma pergunta à aplicação do serviço de apoio técnico.
- A aplicação de apoio técnico transmite a pergunta do cliente ao serviço de obtenção de conhecimentos.
- O serviço de obtenção de conhecimentos cria e envia um comando para a API Gemini no Vertex AI para obter recursos relevantes para a pergunta do cliente.
- O Gemini identifica recursos relevantes a partir de uma base de conhecimentos do apoio técnico armazenada no Cloud Storage.
- O Gemini devolve os IDs dos recursos relevantes ao serviço de obtenção de conhecimentos.
- O serviço de obtenção de conhecimentos obtém os recursos relevantes do Cloud Storage.
- O serviço de obtenção de conhecimentos envia a pergunta do cliente e os recursos relevantes para o serviço de geração de soluções.
- O serviço de geração de soluções envia os recursos para a API Gemini na Vertex AI, com um comando para gerar uma solução detalhada para a pergunta do cliente.
- O Gemini gera uma solução, como instruções passo a passo ou um vídeo explicativo.
- O serviço de geração de soluções fornece a solução ao cliente através da aplicação de serviço de apoio técnico.
Produtos usados
Esta arquitetura de exemplo usa os seguintes Google Cloud produtos:
- Google Kubernetes Engine (GKE): um serviço Kubernetes que pode usar para implementar e operar aplicações em contentores em grande escala através da infraestrutura da Google.
- Vertex AI: uma plataforma de ML que lhe permite preparar e implementar modelos de ML e aplicações de IA, bem como personalizar MDIs/CEs para utilização em aplicações com tecnologia de IA.
- Cloud Storage: um local de armazenamento de objetos de baixo custo e sem limite para diversos tipos de dados. Os dados podem ser acedidos a partir do interior e do exterior Google Cloud, e são replicados em várias localizações para redundância.
Implementação
Para experimentar aplicações de apoio técnico ao cliente assistidas por IA no Google Cloud, use os seguintes exemplos de código:
- Crie uma aplicação de apoio ao cliente que use IA generativa.
- Exemplo de comando para exemplos de utilização do serviço de apoio ao cliente assistido por IA.
O que se segue?
- Crie um agente de apoio ao cliente com o Gemini.
- Crie agentes de IA para exemplos de utilização do apoio ao cliente através de manuais de procedimentos, fluxos, e armazenamentos de dados no Dialogflow CX.
- Explore mais guias de arquitetura de IA generativa.
- Para uma vista geral dos princípios arquitetónicos e das recomendações específicos das cargas de trabalho de IA e ML no Google Cloud, consulte aperspetiva de IA e ML no Framework Well-Architected.
- Para ver mais arquiteturas de referência, diagramas e práticas recomendadas, explore o Centro de arquitetura na nuvem.
Colaboradores
Autor: Kumar Dhanagopal | Cross-Product Solution Developer
Outros colaboradores:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Megan O'Keefe | Consultora de programadores
- Samantha He | Redator técnico
- Shir Meir Lador | Developer Relations Engineering Manager