Crie um aplicativo de chat de IA generativa que usa a geração aumentada por recuperação (RAG) para fornecer respostas fundamentadas e precisas com base nos dados da sua organização. Este guia descreve o modelo de aplicativo RAG de IA generativa com o Cloud SQL, que pode ser personalizado para atender às suas necessidades exclusivas e implantado como um aplicativo.
Por exemplo, você pode implementar esse modelo para atender às seguintes necessidades comerciais:
| Exemplo | Necessidade comercial | Implementação |
|---|---|---|
| Chatbot de suporte ao cliente | As empresas precisam oferecer suporte ao cliente instantâneo. | Hospede a interface de chat no Cloud Run. A Vertex AI processa embeddings e gera respostas com base na documentação técnica armazenada como vetores no Cloud SQL. |
| Assistente de RH interno | Os funcionários precisam encontrar informações sobre benefícios, políticas da empresa e procedimentos internos. | Hospede o assistente de RH no Cloud Run. Quando os funcionários consultam a ferramenta, a Vertex AI recupera informações relevantes sobre políticas do Cloud SQL para gerar respostas precisas e baseadas em fontes. |
| Pesquisador de documentos jurídicos | As equipes jurídicas precisam encontrar rapidamente jurisprudências ou cláusulas contratuais relevantes em grandes repositórios de documentos. | Hospede o portal de pesquisa no Cloud Run. A Vertex AI resume precedentes relevantes e identifica linguagem específica em contratos usando documentos jurídicos armazenados como vetores no Cloud SQL. |
| Pesquisa semântica de produtos | As empresas de e-commerce querem facilitar as pesquisas de produtos usando descrições em linguagem natural em vez de palavras-chave exatas. | Hospede a interface de pesquisa no Cloud Run. A Vertex AI processa as descrições dos usuários para retornar os produtos mais relevantes semanticamente dos catálogos armazenados como vetores no Cloud SQL. |
Arquitetura
A imagem a seguir mostra os componentes e as conexões no aplicativo:
Confira a seguir o fluxo de processamento de solicitações do aplicativo:
- Carregue dados em um banco de dados PostgreSQL no Cloud SQL.
- A Vertex AI cria embeddings de campos de texto e os armazena como vetores no banco de dados.
- Um front-end do Cloud Load Balancing recebe solicitações externas e distribui o tráfego para o back-end do Cloud Load Balancing.
- O back-end do Cloud Load Balancing distribui o tráfego para o serviço de front-end do Cloud Run.
- O serviço de front-end se comunica com um serviço de recuperação para uma chamada de IA generativa.
- O serviço de recuperação usa o Secret Manager para acessar com segurança chaves de API e credenciais necessárias para acessar a Vertex AI e o Cloud SQL.
- O serviço de recuperação converte a solicitação em um embedding e pesquisa vetores semelhantes no banco de dados do Cloud SQL.
- O serviço de recuperação envia os resultados da pesquisa e o comando original à Vertex AI para criar uma resposta.
A seguir
- Saiba como implantar ou duplicar este modelo.
- Entenda como personalizar modelos para atender às suas necessidades específicas.
- Identifique as práticas recomendadas gerais de arquitetura no Google Cloud framework de arquitetura.