Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Arquitetura e principais conceitos da API Conversational Analytics

Este documento descreve os principais conceitos para usar a API Conversational Analytics (acessada por geminidataanalytics.googleapis.com ou endpoints regionais), que permite criar e interagir com agentes de dados que usam linguagem natural para tirar dúvidas sobre dados estruturados. Este documento descreve a arquitetura do agente, os fluxos de trabalho comuns, os modos de conversa, os papéis do Identity and Access Management (IAM) e o design de sistemas multiagentes.

Para revisar as abordagens arquitetônicas disponíveis para a API Conversational Analytics e como a API gerencia o contexto da conversa, consulte Padrões de integração e gerenciamento de estado.

Como os agentes de dados funcionam

Os agentes de dados da API Conversational Analytics usam o contexto (informações e dados comerciais) que você fornece e ferramentas (como SQL e Python) para interpretar perguntas em linguagem natural e gerar respostas com base em seus dados estruturados.

O diagrama a seguir ilustra as etapas do fluxo de trabalho de um agente quando um usuário faz uma pergunta:

Diagrama da arquitetura da API Conversational Analytics, mostrando o fluxo da entrada do usuário por um mecanismo de raciocínio até a saída final.

Como no diagrama, quando um usuário faz uma pergunta, o agente processa a solicitação nas seguintes etapas:

Entrada: o usuário envia uma pergunta em linguagem natural, além de qualquer contexto adicional fornecido anteriormente.
Fontes de dados: o agente se conecta aos seus dados no Looker, no BigQuery (incluindo tabelas ou um gráfico) e no Data Studio para recursos de chat. Ele também pode consultar dados dos bancos de dados do AlloyDB, do GoogleSQL para Spanner, do Cloud SQL para MySQL e do Cloud SQL para PostgreSQL usando o método QueryData.
Mecanismo de raciocínio: o núcleo do agente processa a pergunta do usuário usando as ferramentas disponíveis para gerar uma resposta.
Saída: o agente retorna um fluxo de mensagens, que podem conter texto, dados ou gráficos. Essas mensagens podem incluir citações que vinculam partes específicas do texto de resposta às fontes de contexto fornecidas, como termos de glossário ou consultas de exemplo. Para algumas fontes de dados, as mensagens de texto fornecem insights detalhados sobre o raciocínio do agente, informam o progresso de uma ação ou fornecem a resposta final à consulta.

Workflows para criar e usar agentes

A API Conversational Analytics é compatível com fluxos de trabalho para criadores de agentes (que criam e configuram agentes) e para usuários de agentes (que interagem com agentes existentes).

O diagrama a seguir ilustra o processo completo, desde a configuração inicial por um criador de agente até as interações finais com um usuário de agente:

O fluxo de trabalho completo de criação e uso de agentes, desde tarefas de criador, como criar e compartilhar, até tarefas de usuário de dados, como interagir com um agente.

As seções a seguir descrevem em detalhes os fluxos de trabalho para criadores e usuários de agentes.

O fluxo de trabalho de criação de um agente

O criador de agente é responsável por configurar os agentes. Esse fluxo de trabalho envolve as seguintes etapas:

Criar agente: o criador começa criando um novo agente e fornecendo o contexto necessário, incluindo instruções do sistema e conexões com fontes de dados. Essa etapa é crucial para que o agente entenda e responda as perguntas dos usuários de forma eficaz.
Compartilhar o agente: após a configuração do agente, o criador o compartilha com outros usuários e define os controles de acesso baseados em papéis adequados para gerenciar permissões.

O fluxo de trabalho do usuário do agente

Geralmente, o usuário do agente é um usuário comercial que precisa de respostas de um agente configurado. Esse fluxo de trabalho envolve as seguintes etapas:

Encontrar um agente: o usuário começa encontrando um agente que foi compartilhado com ele.
Fazer uma pergunta: o usuário faz uma pergunta em linguagem natural. Essa pergunta pode ser uma única consulta ou parte de uma conversa dividida em vários turnos.
O agente "raciocina": o mecanismo de raciocínio do agente processa a pergunta. O mecanismo de inferência usa o conhecimento predefinido do agente e as ferramentas disponíveis (como SQL, Python e gráficos) em um "ciclo de raciocínio" para determinar a melhor forma de responder a pergunta.
O agente responde: o agente retorna um fluxo de mensagens, que podem conter texto, dados ou gráficos. Para algumas fontes de dados, as mensagens de texto fornecem insights detalhados sobre o raciocínio do agente, informam o progresso de uma ação ou fornecem a resposta final à consulta.

Modos de conversa

Os agentes da API Conversational Analytics são compatíveis com diferentes modos de conversa que determinam como um agente lida com o histórico de conversas e a persistência do contexto em todas as interações. Os seguintes modos de conversa estão disponíveis:

Modo sem estado: o agente não armazena o histórico da conversa. Cada interação é tratada de forma independente. Esse modo é indicado para situações em que não é necessário manter o contexto em turnos.
Modo com estado: o agente retém o contexto e o histórico da conversa, o que torna as interações mais contextualizadas. Esse modo é indicado para situações em que é necessário manter o contexto em vários turnos. É recomendado para maior precisão e respostas personalizadas.

Escolha um modo de conversa com base no que a situação exige em termos de histórico de conversa e persistência de contexto.

Os diferentes modos de conversa para um agente da API Conversational Analytics.

Papéis IAM

Os papéis do IAM controlam quem pode criar, gerenciar, compartilhar e interagir com os agentes da API Conversational Analytics. Na tabela a seguir, você encontra uma descrição dos principais papéis do IAM para a API Conversational Analytics:

Papel	Escopo típico	O que o papel permite	Quem pode usar o papel
Criador de agente de dados do Gemini Data Analytics (`roles/geminidataanalytics.dataAgentCreator`)	Projeto	Criar agentes e herdar permissões de proprietário neles.	Analistas de dados
Proprietário de agente de dados do Gemini Data Analytics (`roles/geminidataanalytics.dataAgentOwner`)	Projeto, agente	Editar, compartilhar ou excluir agentes com outros usuários.	Analista de dados sênior
Editor de agente de dados do Gemini Data Analytics (`roles/geminidataanalytics.dataAgentEditor`)	Agente, projeto	Atualizar a configuração ou o contexto de um agente.	Analista de dados júnior
Usuário de agente de dados do Gemini Data Analytics (`roles/geminidataanalytics.dataAgentUser`)	Agente, projeto	Conversar com um agente.	Profissional de marketing, proprietário do repositório
Leitor de agente de dados do Gemini Data Analytics (`roles/geminidataanalytics.dataAgentViewer`)	Projeto, agente	Listar agentes e acessar os detalhes deles. Não é possível editar o agente.	Qualquer usuário
Usuário de consulta de dados do Gemini Data Analytics (`roles/geminidataanalytics.queryDataUser`)	Projeto	Consultar dados de fontes de banco de dados compatíveis usando o método `QueryData`.	Desenvolvedor de aplicativos, analista de dados
Usuário de chat sem estado do Gemini Data Analytics (`roles/geminidataanalytics.dataAgentStatelessUser`)	Projeto	Conversar com um representante sem armazenamento de contexto ou histórico de conversa.	Qualquer usuário

Sistemas com vários agentes

É possível desenvolver sistemas complexos integrando vários agentes da API Conversational Analytics. Um padrão comum é usar um agente "orquestrador" principal que delega tarefas a um ou mais agentes especializados que lidam com domínios específicos, como dados de vendas ou de marketing. Dessa forma, é possível criar um sistema que lida com diversas perguntas combinando os pontos fortes de vários agentes.

O diagrama a seguir ilustra esse padrão multiagente e mostra como um agente principal pode delegar uma pergunta de dados a um agente especializado do Conversational Analytics:

Um agente orquestrador principal delega uma pergunta sobre dados a um agente de vendas especializado, que retorna uma resposta ao usuário.

O fluxo de trabalho típico de um sistema multiagente envolve as seguintes etapas:

Um usuário comercial ou analista de dados faz uma pergunta em linguagem natural, como "Mostre as três principais lojas por receita".
Um agente "orquestrador" principal delega a solicitação ao agente especializado competente.
O agente especializado recebe a solicitação delegada, se conecta às fontes de dados pertinentes, usa as ferramentas para gerar as consultas SQL e os gráficos necessários e gera uma resposta.
A resposta do agente especializado é enviada ao usuário, como "As lojas 4, 9 e 3 têm a maior receita. Confira o gráfico."

A seguir

Depois de entender os conceitos básicos da API Conversational Analytics, saiba como implementar estes recursos:

Compare os padrões de integração arquitetônica para determinar a melhor abordagem para seu aplicativo.
Entenda o gerenciamento de estado para agentes de dados e como a API gerencia o contexto da conversa.
Saiba como se autenticar e se conectar a uma fonte de dados.
Saiba como criar e configurar um agente com HTTP.
Saiba como criar e configurar um agente com Python.
Saiba como orientar o comportamento de um agente com contexto criado.
Entenda o controle de acesso com o IAM para a API Conversational Analytics.
Saiba como proteger seus agentes de dados e conversas usando a CMEK.
Saiba como renderizar respostas de agentes para fontes de dados do Looker.

Arquitetura e principais conceitos da API Conversational Analytics Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.