Caso de uso da IA agêntica: automatizar fluxos de trabalho de ciência de dados

Last reviewed 2025-12-08 UTC

Este documento descreve uma arquitetura de alto nível para um aplicativo que executa um fluxo de trabalho de ciência de dados para automatizar tarefas complexas de análise de dados e aprendizado de máquina.

Essa arquitetura usa conjuntos de dados hospedados no BigQuery ou no AlloyDB para PostgreSQL. A arquitetura é um sistema multiagente que permite aos usuários executar ações em comandos de linguagem natural e elimina a necessidade de escrever códigos complexos em SQL ou Python.

O público-alvo deste documento inclui arquitetos, desenvolvedores e administradores que criam e gerenciam aplicativos de IA com agentes. Essa arquitetura permite que as equipes de negócios e de dados analisem métricas em vários setores, como varejo, finanças e manufatura. O documento pressupõe um entendimento básico dos sistemas de IA com agentes. Para saber como os agentes diferem de sistemas não agentes, consulte Qual é a diferença entre agentes de IA, assistentes de IA e bots?

A seção Implantação deste documento fornece links para exemplos de código que ajudam você a testar a implantação de um aplicativo de IA com agente que executa um fluxo de trabalho de ciência de dados.

Arquitetura

O diagrama a seguir mostra a arquitetura de um agente de fluxo de trabalho de ciência de dados.

Arquitetura para um agente de fluxo de trabalho de ciência de dados.

Essa arquitetura inclui os seguintes componentes:

Componente Descrição
Front-end Os usuários interagem com o sistema multiagente por um front-end, como uma interface de chat, que é executada como um serviço sem servidor do Cloud Run.
Agentes Essa arquitetura usa os seguintes agentes:
  • Agente raiz: um agente coordenador que recebe solicitações do serviço de front-end. O agente raiz interpreta a solicitação do usuário e tenta resolver o problema por conta própria. Se a tarefa exigir ferramentas especializadas, o agente raiz vai delegar a solicitação ao agente especializado adequado.
  • Agente especializado: o agente raiz invoca os seguintes agentes especializados usando o recurso agente como ferramenta.
    • Agente de análise: um agente especializado em análise e visualização de dados. O agente de análise usa o modelo de IA para gerar e executar código Python, processar conjuntos de dados, criar gráficos e realizar análises estatísticas.
    • Agente do AlloyDB para PostgreSQL: um agente especializado para interagir com dados no AlloyDB para PostgreSQL. O agente usa o modelo de IA para interpretar a solicitação do usuário e gerar SQL no dialeto PostgreSQL. O agente se conecta com segurança ao banco de dados usando a MCP Toolbox for Databases e executa a consulta para recuperar os dados solicitados.
    • Agente do BigQuery: um agente especializado para interagir com dados no BigQuery. O agente usa o modelo de IA para interpretar a solicitação do usuário e gerar consultas GoogleSQL. O agente se conecta ao banco de dados usando a ferramenta integrada do BigQuery do Kit de desenvolvimento de agentes (ADK) e executa a consulta para recuperar os dados solicitados.
  • Agente do BigQuery ML: um subagente do agente raiz dedicado a fluxos de trabalho de machine learning. O agente interage com o BigQuery ML para gerenciar o ciclo de vida de ML de ponta a ponta. O agente pode criar e treinar modelos, executar avaliações e gerar previsões com base nas solicitações dos usuários.
Ambiente de execução de agentes Os agentes de IA nesta arquitetura são implantados como serviços sem servidor do Cloud Run.
ADK O ADK oferece ferramentas e um framework para desenvolver, testar e implantar agentes. O ADK abstrai a complexidade da criação de agentes e permite que os desenvolvedores de IA se concentrem na lógica e nos recursos do agente.
Modelos de IA e tempos de execução de modelos Para veiculação de inferência, os agentes nesta arquitetura de exemplo usam o modelo do Gemini mais recente na Vertex AI.

Produtos usados

Esta arquitetura de exemplo usa os seguintes produtos e ferramentas Google Cloud e de código aberto:

  • Cloud Run: uma plataforma de computação sem servidor que permite executar contêineres diretamente na infraestrutura escalonável do Google.
  • Kit de desenvolvimento de agentes (ADK): um conjunto de ferramentas e bibliotecas para desenvolver, testar e implantar agentes de IA.
  • Vertex AI: uma plataforma de ML que permite treinar e implantar modelos de ML e aplicativos de IA, além de personalizar LLMs para uso em aplicativos com tecnologia de IA.
  • Gemini: uma família de modelos multimodais de IA desenvolvida pelo Google.
  • BigQuery: um data warehouse corporativo que ajuda a gerenciar e analisar seus dados com recursos integrados, como análise geoespacial de machine learning e Business Intelligence.
  • AlloyDB para PostgreSQL: um serviço de banco de dados totalmente gerenciado e compatível com PostgreSQL, projetado para as cargas de trabalho mais exigentes, incluindo processamento analítico e transacional híbrido.
  • MCP Toolbox for Databases: um servidor de Protocolo de contexto de modelo (MCP) de código aberto que permite que agentes de IA se conectem com segurança a bancos de dados gerenciando complexidades como pool de conexões, autenticação e capacidade de observação.

Implantação

Para implantar uma implementação de amostra dessa arquitetura, use Ciência de dados com vários agentes. O repositório oferece dois conjuntos de dados de amostra para demonstrar a flexibilidade do sistema, incluindo um conjunto de dados de voos para análise operacional e um conjunto de dados de vendas de e-commerce para análise de negócios.

A seguir

Colaboradores

Autora: Samantha He | Gravadora técnica

Outros colaboradores: