Caso de uso da IA agêntica: automatizar fluxos de trabalho de ciência de dados

Este documento descreve uma arquitetura de alto nível para um aplicativo que executa um fluxo de trabalho de ciência de dados para automatizar tarefas complexas de análise de dados e aprendizado de máquina.

Essa arquitetura usa conjuntos de dados hospedados no BigQuery ou no AlloyDB para PostgreSQL. A arquitetura é um sistema multiagente que permite aos usuários executar ações em comandos de linguagem natural e elimina a necessidade de escrever códigos complexos em SQL ou Python.

O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA com agentes. Essa arquitetura permite que as equipes de negócios e de dados analisem métricas em vários setores, como varejo, finanças e manufatura. O documento pressupõe um entendimento básico dos sistemas de IA com agentes. Para saber como os agentes diferem de sistemas não agentes, consulte Qual é a diferença entre agentes de IA, assistentes de IA e bots?

A seção Implantação deste documento fornece links para exemplos de código que ajudam você a testar a implantação de um aplicativo de IA com agente que executa um fluxo de trabalho de ciência de dados.

Arquitetura

O diagrama a seguir mostra a arquitetura de um agente de fluxo de trabalho de ciência de dados.

Arquitetura para um agente de fluxo de trabalho de ciência de dados.

Essa arquitetura inclui os seguintes componentes:

Componente Descrição
Front-end Os usuários interagem com o sistema multiagente por um front-end, como uma interface de chat, que é executada como um serviço sem servidor do Cloud Run.
Agentes Essa arquitetura usa os seguintes agentes:
  • Agente raiz: um agente coordenador que recebe solicitações do serviço de front-end. O agente raiz interpreta a solicitação do usuário e tenta resolver o problema por conta própria. Se a tarefa exigir ferramentas especializadas, o agente raiz vai delegar a solicitação ao agente especializado adequado.
  • Agente especializado: o agente raiz invoca os seguintes agentes especializados usando o recurso agente como ferramenta.
    • Agente de análise: um agente especializado em análise e visualização de dados. O agente de análise usa o modelo de IA para gerar e executar código Python, processar conjuntos de dados, criar gráficos e realizar análises estatísticas.
    • Agente do AlloyDB para PostgreSQL: um agente especializado para interagir com dados no AlloyDB para PostgreSQL. O agente usa o modelo de IA para interpretar a solicitação do usuário e gerar SQL no dialeto PostgreSQL. O agente se conecta com segurança ao banco de dados usando a MCP Toolbox for Databases e executa a consulta para recuperar os dados solicitados.
    • Agente do BigQuery: um agente especializado para interagir com dados no BigQuery. O agente usa o modelo de IA para interpretar a solicitação do usuário e gerar consultas GoogleSQL. O agente se conecta ao banco de dados usando a ferramenta integrada do BigQuery do Kit de desenvolvimento de agentes (ADK) e executa a consulta para recuperar os dados solicitados.
  • Agente do BigQuery ML: um subagente do agente raiz dedicado a fluxos de trabalho de machine learning. O agente interage com o BigQuery ML para gerenciar o ciclo de vida de ML de ponta a ponta. O agente pode criar e treinar modelos, executar avaliações e gerar previsões com base nas solicitações dos usuários.
Ambiente de execução de agentes Os agentes de IA nesta arquitetura são implantados como serviços sem servidor do Cloud Run.
ADK O ADK oferece ferramentas e um framework para desenvolver, testar e implantar agentes. O ADK abstrai a complexidade da criação de agentes e permite que os desenvolvedores de IA se concentrem na lógica e nos recursos do agente.
Modelos de IA e tempos de execução de modelos Para veiculação de inferência, os agentes nesta arquitetura de exemplo usam o modelo do Gemini mais recente na Vertex AI.

Produtos usados

Esta arquitetura de exemplo usa os seguintes produtos e ferramentas Google Cloud e de código aberto:

  • Cloud Run: uma plataforma de computação sem servidor que permite executar contêineres diretamente na infraestrutura escalonável do Google.
  • Kit de desenvolvimento de agentes (ADK): um conjunto de ferramentas e bibliotecas para desenvolver, testar e implantar agentes de IA.
  • Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
  • Gemini: uma família de modelos multimodais de IA desenvolvida pelo Google.
  • BigQuery: um data warehouse corporativo que ajuda a gerenciar e analisar seus dados com recursos integrados, como análise geoespacial de machine learning e Business Intelligence.
  • AlloyDB para PostgreSQL: um serviço de banco de dados totalmente gerenciado e compatível com PostgreSQL, projetado para as cargas de trabalho mais exigentes, incluindo processamento analítico e transacional híbrido.
  • MCP Toolbox for Databases: um servidor de Protocolo de contexto de modelo (MCP) de código aberto que permite que agentes de IA se conectem com segurança a bancos de dados gerenciando complexidades como pool de conexões, autenticação e capacidade de observação.

Implantação

Para implantar uma implementação de amostra dessa arquitetura, use Ciência de dados com vários agentes. O repositório oferece dois conjuntos de dados de amostra para demonstrar a flexibilidade do sistema, incluindo um conjunto de dados de voos para análise operacional e um conjunto de dados de vendas de e-commerce para análise de negócios.

A seguir

Colaboradores

Autora: Samantha He | Redatora técnica

Outros colaboradores: