Caso práctico de IA de agentes: automatizar flujos de trabajo de ciencia de datos

En este documento se describe una arquitectura de alto nivel para una aplicación que ejecuta un flujo de trabajo de ciencia de datos para automatizar tareas complejas de analíticas de datos y aprendizaje automático.

Esta arquitectura usa conjuntos de datos alojados en BigQuery o AlloyDB para PostgreSQL. La arquitectura es un sistema multiagente que permite a los usuarios ejecutar acciones con comandos en lenguaje natural y elimina la necesidad de escribir código SQL o Python complejo.

Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA basadas en agentes. Esta arquitectura permite a los equipos empresariales y de datos analizar métricas de una amplia gama de sectores, como el comercio minorista, las finanzas y la fabricación. En este documento, se da por sentado que el lector tiene conocimientos básicos sobre los sistemas de IA basados en agentes. Para obtener información sobre las diferencias entre los agentes y los sistemas sin agentes, consulta ¿En qué se diferencian los agentes, los asistentes y los bots de IA?

En la sección Despliegue de este documento se proporcionan enlaces a ejemplos de código para ayudarte a experimentar con el despliegue de una aplicación de IA basada en agentes que ejecuta un flujo de trabajo de ciencia de datos.

Arquitectura

En el siguiente diagrama se muestra la arquitectura de un flujo de trabajo de ciencia de datos agente.

Arquitectura de un agente de flujo de trabajo de ciencia de datos.

Esta arquitectura incluye los siguientes componentes:

Componente Descripción
Frontend Los usuarios interactúan con el sistema multiagente a través de un frontend, como una interfaz de chat, que se ejecuta como un servicio de Cloud Run sin servidor.
Agentes Esta arquitectura usa los siguientes agentes:
  • Agente raíz: un agente coordinador que recibe solicitudes del servicio frontend. El agente raíz interpreta la solicitud del usuario e intenta resolverla por sí mismo. Si la tarea requiere herramientas especializadas, el agente raíz delega la solicitud en el agente especializado adecuado.
  • Agente especializado: el agente raíz invoca a los siguientes agentes especializados mediante la función agente como herramienta.
    • Agente de analíticas: agente especializado en el análisis y la visualización de datos. El agente de analíticas usa el modelo de IA para generar y ejecutar código Python para procesar conjuntos de datos, crear gráficos y realizar análisis estadísticos.
    • Agente de AlloyDB para PostgreSQL: agente especializado para interactuar con datos de AlloyDB para PostgreSQL. El agente usa el modelo de IA para interpretar la solicitud del usuario y generar SQL en el dialecto de PostgreSQL. El agente se conecta de forma segura a la base de datos mediante MCP Toolbox for Databases y, a continuación, ejecuta la consulta para recuperar los datos solicitados.
    • Agente de BigQuery: un agente especializado para interactuar con datos de BigQuery. El agente usa el modelo de IA para interpretar la solicitud del usuario y generar consultas de GoogleSQL. El agente se conecta a la base de datos mediante la herramienta BigQuery integrada de Agent Development Kit (ADK) y, a continuación, ejecuta la consulta para obtener los datos solicitados.
  • Agente de BigQuery ML: subagente del agente raíz dedicado a los flujos de trabajo de aprendizaje automático. El agente interactúa con BigQuery ML para gestionar todo el ciclo de vida del aprendizaje automático. El agente puede crear y entrenar modelos, realizar evaluaciones y generar predicciones en función de las solicitudes de los usuarios.
Tiempo de ejecución de agentes Los agentes de IA de esta arquitectura se despliegan como servicios de Cloud Run sin servidor.
ADK ADK proporciona herramientas y un framework para desarrollar, probar e implementar agentes. ADK abstrae la complejidad de la creación de agentes y permite a los desarrolladores de IA centrarse en la lógica y las funciones del agente.
Modelos de IA y tiempos de ejecución de modelos Para el servicio de inferencias, los agentes de esta arquitectura de ejemplo usan el modelo de Gemini más reciente en Vertex AI.

Productos usados

Esta arquitectura de ejemplo usa los siguientes productos y herramientas Google Cloud y de código abierto:

  • Cloud Run: una plataforma de computación sin servidor que te permite ejecutar contenedores directamente en la infraestructura escalable de Google.
  • Agent Development Kit (ADK): un conjunto de herramientas y bibliotecas para desarrollar, probar y desplegar agentes de IA.
  • Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
  • Gemini:familia de modelos de IA multimodales desarrollada por Google.
  • BigQuery: un almacén de datos empresariales que te ayuda a gestionar y analizar tus datos con funciones integradas como el aprendizaje automático, el análisis geoespacial y la inteligencia empresarial.
  • AlloyDB para PostgreSQL: servicio de bases de datos totalmente gestionado y compatible con PostgreSQL diseñado para las cargas de trabajo más exigentes, incluido el procesamiento híbrido transaccional y analítico.
  • MCP Toolbox for Databases: un servidor de Model Context Protocol (MCP) de código abierto que permite a los agentes de IA conectarse de forma segura a las bases de datos gestionando las complejidades de las bases de datos, como la agrupación de conexiones, la autenticación y la observabilidad.

Implementación

Para implementar un ejemplo de esta arquitectura, consulta Ciencia de datos con varios agentes. El repositorio proporciona dos conjuntos de datos de muestra para demostrar la flexibilidad del sistema, incluido un conjunto de datos de vuelos para el análisis operativo y un conjunto de datos de ventas de comercio electrónico para las analíticas empresariales.

Siguientes pasos

Colaboradores

Autor: Samantha He | Redactora técnica

Otros colaboradores: