En este documento se describe una arquitectura de alto nivel para una aplicación que ejecuta un flujo de trabajo de ciencia de datos para automatizar tareas complejas de analíticas de datos y aprendizaje automático.
Esta arquitectura usa conjuntos de datos alojados en BigQuery o AlloyDB para PostgreSQL. La arquitectura es un sistema multiagente que permite a los usuarios ejecutar acciones con comandos en lenguaje natural y elimina la necesidad de escribir código SQL o Python complejo.
Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA basadas en agentes. Esta arquitectura permite a los equipos empresariales y de datos analizar métricas de una amplia gama de sectores, como el comercio minorista, las finanzas y la fabricación. En este documento, se da por sentado que el lector tiene conocimientos básicos sobre los sistemas de IA basados en agentes. Para obtener información sobre las diferencias entre los agentes y los sistemas sin agentes, consulta ¿En qué se diferencian los agentes, los asistentes y los bots de IA?
En la sección Despliegue de este documento se proporcionan enlaces a ejemplos de código para ayudarte a experimentar con el despliegue de una aplicación de IA basada en agentes que ejecuta un flujo de trabajo de ciencia de datos.
Arquitectura
En el siguiente diagrama se muestra la arquitectura de un flujo de trabajo de ciencia de datos agente.
Esta arquitectura incluye los siguientes componentes:
| Componente | Descripción |
|---|---|
| Frontend | Los usuarios interactúan con el sistema multiagente a través de un frontend, como una interfaz de chat, que se ejecuta como un servicio de Cloud Run sin servidor. |
| Agentes | Esta arquitectura usa los siguientes agentes:
|
| Tiempo de ejecución de agentes | Los agentes de IA de esta arquitectura se despliegan como servicios de Cloud Run sin servidor. |
| ADK | ADK proporciona herramientas y un framework para desarrollar, probar e implementar agentes. ADK abstrae la complejidad de la creación de agentes y permite a los desarrolladores de IA centrarse en la lógica y las funciones del agente. |
| Modelos de IA y tiempos de ejecución de modelos | Para el servicio de inferencias, los agentes de esta arquitectura de ejemplo usan el modelo de Gemini más reciente en Vertex AI. |
Productos usados
Esta arquitectura de ejemplo usa los siguientes productos y herramientas Google Cloud y de código abierto:
- Cloud Run: una plataforma de computación sin servidor que te permite ejecutar contenedores directamente en la infraestructura escalable de Google.
- Agent Development Kit (ADK): un conjunto de herramientas y bibliotecas para desarrollar, probar y desplegar agentes de IA.
- Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
- Gemini:familia de modelos de IA multimodales desarrollada por Google.
- BigQuery: un almacén de datos empresariales que te ayuda a gestionar y analizar tus datos con funciones integradas como el aprendizaje automático, el análisis geoespacial y la inteligencia empresarial.
- AlloyDB para PostgreSQL: servicio de bases de datos totalmente gestionado y compatible con PostgreSQL diseñado para las cargas de trabajo más exigentes, incluido el procesamiento híbrido transaccional y analítico.
- MCP Toolbox for Databases: un servidor de Model Context Protocol (MCP) de código abierto que permite a los agentes de IA conectarse de forma segura a las bases de datos gestionando las complejidades de las bases de datos, como la agrupación de conexiones, la autenticación y la observabilidad.
Implementación
Para implementar un ejemplo de esta arquitectura, consulta Ciencia de datos con varios agentes. El repositorio proporciona dos conjuntos de datos de muestra para demostrar la flexibilidad del sistema, incluido un conjunto de datos de vuelos para el análisis operativo y un conjunto de datos de ventas de comercio electrónico para las analíticas empresariales.
Siguientes pasos
- (Vídeo) Consulta el pódcast Agent Factory sobre agentes de IA para ingeniería y ciencia de datos.
- (Cuaderno) Usa el agente de ciencia de datos en Colab Enterprise.
- Consulta cómo alojar agentes de IA en Cloud Run.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos de las cargas de trabajo de IA y aprendizaje automático en Google Cloud, consulta la sección Perspectiva de IA y aprendizaje automático del framework Well-Architected.
- Para ver más arquitecturas de referencia, diagramas y prácticas recomendadas, consulta el centro de arquitectura de Cloud.
Colaboradores
Autor: Samantha He | Redactora técnica
Otros colaboradores:
- Amina Mansour | Responsable del equipo de evaluaciones de Cloud Platform
- Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Gestora de Ingeniería de Relaciones con Desarrolladores