Exemplo de utilização da IA com agentes: automatize fluxos de trabalho de ciência de dados

Este documento descreve uma arquitetura de alto nível para uma aplicação que executa um fluxo de trabalho de ciência de dados para automatizar tarefas complexas de análise de dados e aprendizagem automática.

Esta arquitetura usa conjuntos de dados alojados no BigQuery ou no AlloyDB para PostgreSQL. A arquitetura é um sistema multiagente que permite aos utilizadores executar ações em comandos de linguagem natural e elimina a necessidade de escrever código SQL ou Python complexo.

O público-alvo deste documento inclui arquitetos, programadores e administradores que criam e gerem aplicações de IA autónoma. Esta arquitetura permite que as equipas empresariais e de dados analisem métricas numa vasta gama de setores, como o retalho, as finanças e a indústria. O documento pressupõe uma compreensão fundamental dos sistemas de IA agênticos. Para informações sobre a diferença entre os agentes e os sistemas não baseados em agentes, consulte o artigo Qual é a diferença entre agentes de IA, assistentes de IA e bots?

A secção Implementação deste documento fornece links para exemplos de código para ajudar a experimentar a implementação de uma aplicação de IA autónoma que executa um fluxo de trabalho de ciência de dados.

Arquitetura

O diagrama seguinte mostra a arquitetura de um agente de fluxo de trabalho de ciência dos dados.

Arquitetura para um agente de fluxo de trabalho de ciência dos dados.

Esta arquitetura inclui os seguintes componentes:

Componente Descrição
Front-End Os utilizadores interagem com o sistema multiagente através de uma interface, como uma interface de chat, que é executada como um serviço Cloud Run sem servidor.
Agentes Esta arquitetura usa os seguintes agentes:
  • Agente raiz: um agente coordenador que recebe pedidos do serviço de frontend. O agente raiz interpreta o pedido do utilizador e tenta resolver o pedido por si próprio. Se a tarefa exigir ferramentas especializadas, o agente raiz delega o pedido ao agente especializado adequado.
  • Agente especializado: o agente principal invoca os seguintes agentes especializados através da funcionalidade agente como ferramenta.
    • Agente de estatísticas: um agente especializado para análise e visualização de dados. O agente de estatísticas usa o modelo de IA para gerar e executar código Python para processar conjuntos de dados, criar gráficos e fazer análises estatísticas.
    • Agente do AlloyDB para PostgreSQL: um agente especializado para interagir com dados no AlloyDB para PostgreSQL. O agente usa o modelo de IA para interpretar o pedido do utilizador e gerar SQL no dialeto PostgreSQL. O agente liga-se em segurança à base de dados através da caixa de ferramentas do MCP para bases de dados e, em seguida, executa a consulta para obter os dados pedidos.
    • Agente do BigQuery: um agente especializado para interagir com dados no BigQuery. O agente usa o modelo de IA para interpretar o pedido do utilizador e gerar consultas GoogleSQL. O agente liga-se à base de dados através da ferramenta BigQuery incorporada no Agent Development Kit (ADK) e, em seguida, executa a consulta para obter os dados pedidos.
  • Agente do BigQuery ML: um subagente do agente raiz dedicado a fluxos de trabalho de aprendizagem automática. O agente interage com o BigQuery ML para gerir o ciclo de vida de ML completo. O agente pode criar e formar modelos, executar avaliações e gerar previsões com base em pedidos dos utilizadores.
Tempo de execução dos agentes Os agentes de IA nesta arquitetura são implementados como serviços do Cloud Run sem servidor.
ADK O ADK oferece ferramentas e uma estrutura para desenvolver, testar e implementar agentes. O ADK abstrai a complexidade da criação de agentes e permite que os programadores de IA se concentrem na lógica e nas capacidades do agente.
Modelo de IA e tempos de execução do modelo Para o serviço de inferência, os agentes nesta arquitetura de exemplo usam o modelo Gemini mais recente na Vertex AI.

Produtos usados

Esta arquitetura de exemplo usa os seguintes produtos Google Cloud e de código aberto e ferramentas:

  • Cloud Run: uma plataforma de computação sem servidor que lhe permite executar contentores diretamente na infraestrutura escalável da Google.
  • Agent Development Kit (ADK): um conjunto de ferramentas e bibliotecas para desenvolver, testar e implementar agentes de IA.
  • Vertex AI: uma plataforma de ML que lhe permite preparar e implementar modelos de ML e aplicações de IA, bem como personalizar MDIs/CEs para utilização em aplicações com tecnologia de IA.
  • Gemini: uma família de modelos de IA multimodal desenvolvidos pela Google.
  • BigQuery: um armazém de dados empresariais que ajuda a gerir e analisar os seus dados com funcionalidades integradas, como aprendizagem automática, análise geoespacial e Business Intelligence.
  • AlloyDB para PostgreSQL: um serviço de base de dados totalmente gerido e compatível com PostgreSQL concebido para as suas cargas de trabalho mais exigentes, incluindo o processamento transacional e analítico híbrido.
  • Caixa de ferramentas do MCP para bases de dados: um servidor de protocolo Model Context Protocol (MCP) de código aberto que permite que os agentes de IA se liguem em segurança a bases de dados através da gestão de complexidades de bases de dados, como o agrupamento de ligações, a autenticação e a observabilidade.

Implementação

Para implementar uma implementação de exemplo desta arquitetura, use a Ciência de dados com vários agentes. O repositório fornece dois conjuntos de dados de exemplo para demonstrar a flexibilidade do sistema, incluindo um conjunto de dados de voos para análise operacional e um conjunto de dados de vendas de comércio eletrónico para estatísticas empresariais.

O que se segue?

Colaboradores

Autor: Samantha He | Redator técnico

Outros colaboradores: