Caso de uso de la IA basada en agentes: Automatiza los flujos de trabajo de la ciencia de datos

Last reviewed 2025-12-08 UTC

En este documento, se describe una arquitectura de alto nivel para una aplicación que ejecuta un flujo de trabajo de ciencia de datos para automatizar tareas complejas de análisis de datos y aprendizaje automático.

Esta arquitectura usa conjuntos de datos alojados en BigQuery o AlloyDB para PostgreSQL. La arquitectura es un sistema multiagente que permite a los usuarios ejecutar acciones con comandos en lenguaje natural y elimina la necesidad de escribir código complejo en SQL o Python.

El público previsto para este documento incluye arquitectos, desarrolladores y administradores que compilan y administran aplicaciones de IA basadas en agentes. Esta arquitectura permite que los equipos de datos y de negocios analicen métricas en una amplia variedad de industrias, como la venta minorista, las finanzas y la fabricación. En este documento, se supone que tienes conocimientos básicos sobre los sistemas de agentes de IA. Para obtener información sobre cómo se diferencian los agentes de los sistemas no basados en agentes, consulta ¿Cuál es la diferencia entre agentes de IA, asistentes de IA y bots?

La sección de implementación de este documento proporciona vínculos a muestras de código para ayudarte a experimentar con la implementación de una aplicación de IA basada en agentes que ejecuta un flujo de trabajo de ciencia de datos.

Arquitectura

En el siguiente diagrama, se muestra la arquitectura de un agente de flujo de trabajo de ciencia de datos.

Arquitectura de un agente de flujo de trabajo de ciencia de datos.

Esta arquitectura incluye los siguientes componentes:

Componente	Descripción
Frontend	Los usuarios interactúan con el sistema de varios agentes a través de una interfaz de usuario, como una interfaz de chat, que se ejecuta como un servicio de Cloud Run sin servidores.
Agentes	Esta arquitectura usa los siguientes agentes: Agente raíz: Es un agente coordinador que recibe solicitudes del servicio de frontend. El agente raíz interpreta la solicitud del usuario y trata de resolverla por sí mismo. Si la tarea requiere herramientas especializadas, el agente raíz delega la solicitud al agente especializado adecuado. Agente especializado: El agente raíz invoca los siguientes agentes especializados con la función agente como herramienta. Agente de Analytics: Es un agente especializado en el análisis y la visualización de datos. El agente de análisis usa el modelo de IA para generar y ejecutar código de Python para procesar conjuntos de datos, crear gráficos y realizar análisis estadísticos. Agente de AlloyDB para PostgreSQL: Es un agente especializado para interactuar con los datos en AlloyDB para PostgreSQL. El agente usa el modelo de IA para interpretar la solicitud del usuario y generar SQL en el dialecto de PostgreSQL. El agente se conecta de forma segura a la base de datos con MCP Toolbox for Databases y, luego, ejecuta la consulta para recuperar los datos solicitados. Agente de BigQuery: Es un agente especializado para interactuar con los datos en BigQuery. El agente usa el modelo de IA para interpretar la solicitud del usuario y generar consultas en GoogleSQL. El agente se conecta a la base de datos con la herramienta integrada de BigQuery del Agent Development Kit (ADK) y, luego, ejecuta la consulta para recuperar los datos solicitados. Agente de BigQuery ML: Es un subagente del agente raíz que se dedica a los flujos de trabajo de aprendizaje automático. El agente interactúa con BigQuery ML para administrar el ciclo de vida del AA de extremo a extremo. El agente puede crear y entrenar modelos, ejecutar evaluaciones y generar predicciones basadas en las solicitudes de los usuarios.
Tiempo de ejecución de agentes	Los agentes de IA en esta arquitectura se implementan como servicios de Cloud Run sin servidores.
ADK	El ADK proporciona herramientas y un framework para desarrollar, probar y, luego, implementar agentes. El ADK abstrae la complejidad de la creación de agentes y permite que los desarrolladores de IA se enfoquen en la lógica y las capacidades del agente.
Modelos de IA y tiempos de ejecución de modelos	Para la entrega de inferencias, los agentes de esta arquitectura de ejemplo usan el modelo de Gemini más reciente en Vertex AI.

Productos usados

En esta arquitectura de ejemplo, se usan los siguientes productos y herramientas de Google Cloud y de código abierto:

Cloud Run es una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
Kit de desarrollo de agentes (ADK): Es un conjunto de herramientas y bibliotecas para desarrollar, probar e implementar agentes de IA.
Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
Gemini : Es una familia de modelos de IA multimodales desarrollados por Google.

BigQuery: Un almacén de datos empresarial que te ayuda a administrar y analizar tus datos con funciones integradas como el análisis geoespacial de aprendizaje automático y la inteligencia empresarial.
AlloyDB para PostgreSQL: Un servicio de base de datos completamente administrado, compatible con PostgreSQL, que está diseñado para cargas de trabajo exigentes, incluido el procesamiento híbrido transaccional y analítico.
MCP Toolbox for Databases: Es un servidor de Model Context Protocol (MCP) de código abierto que permite que los agentes de IA se conecten de forma segura a las bases de datos administrando las complejidades de las bases de datos, como la agrupación de conexiones, la autenticación y la observabilidad.

Implementación

Para implementar una muestra de esta arquitectura, usa Data Science with Multiple Agents. El repositorio proporciona dos conjuntos de datos de muestra para demostrar la flexibilidad del sistema, incluido un conjunto de datos de vuelos para el análisis operativo y un conjunto de datos de ventas de comercio electrónico para el análisis empresarial.

¿Qué sigue?

(Video) Mira el podcast de Agent Factory sobre los agentes de IA para la ingeniería de datos y la ciencia de datos.
(Notebook) Usa el agente de ciencia de datos en Colab Enterprise.
Obtén más información para alojar agentes de IA en Cloud Run.
Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos para las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
Para obtener más información sobre las arquitecturas de referencia, los diagramas y las prácticas recomendadas, explora Cloud Architecture Center.

Colaboradores

Autora: Samantha He | Escritora técnica

Otros colaboradores:

Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
Megan O'Keefe | Developer Advocate
Rachael Deacon-Smith | Developer Advocate
Shir Meir Lador | Gerente de Ingeniería de Relaciones con Desarrolladores

Caso de uso de la IA basada en agentes: Automatiza los flujos de trabajo de la ciencia de datos Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.