En este documento, se describe una arquitectura de alto nivel para una aplicación que ejecuta un flujo de trabajo de ciencia de datos para automatizar tareas complejas de análisis de datos y aprendizaje automático.
Esta arquitectura usa conjuntos de datos alojados en BigQuery o AlloyDB para PostgreSQL. La arquitectura es un sistema multiagente que permite a los usuarios ejecutar acciones con comandos en lenguaje natural y elimina la necesidad de escribir código complejo en SQL o Python.
El público previsto para este documento incluye arquitectos, desarrolladores y administradores que compilan y administran aplicaciones de IA basadas en agentes. Esta arquitectura permite que los equipos de datos y de negocios analicen métricas en una amplia variedad de industrias, como la venta minorista, las finanzas y la fabricación. En este documento, se supone que tienes conocimientos básicos sobre los sistemas de agentes de IA. Para obtener información sobre cómo se diferencian los agentes de los sistemas no basados en agentes, consulta ¿Cuál es la diferencia entre agentes de IA, asistentes de IA y bots?
La sección de implementación de este documento proporciona vínculos a muestras de código para ayudarte a experimentar con la implementación de una aplicación de IA basada en agentes que ejecuta un flujo de trabajo de ciencia de datos.
Arquitectura
En el siguiente diagrama, se muestra la arquitectura de un agente de flujo de trabajo de ciencia de datos.
Esta arquitectura incluye los siguientes componentes:
| Componente | Descripción |
|---|---|
| Frontend | Los usuarios interactúan con el sistema de varios agentes a través de una interfaz de usuario, como una interfaz de chat, que se ejecuta como un servicio de Cloud Run sin servidores. |
| Agentes | Esta arquitectura usa los siguientes agentes:
|
| Tiempo de ejecución de agentes | Los agentes de IA en esta arquitectura se implementan como servicios de Cloud Run sin servidores. |
| ADK | El ADK proporciona herramientas y un framework para desarrollar, probar y, luego, implementar agentes. El ADK abstrae la complejidad de la creación de agentes y permite que los desarrolladores de IA se enfoquen en la lógica y las capacidades del agente. |
| Modelos de IA y tiempos de ejecución de modelos | Para la entrega de inferencias, los agentes de esta arquitectura de ejemplo usan el modelo de Gemini más reciente en Vertex AI. |
Productos usados
En esta arquitectura de ejemplo, se usan los siguientes productos y herramientas de Google Cloud y de código abierto:
- Cloud Run es una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
- Kit de desarrollo de agentes (ADK): Es un conjunto de herramientas y bibliotecas para desarrollar, probar e implementar agentes de IA.
- Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
- Gemini: Es una familia de modelos de IA multimodales desarrollados por Google.
- BigQuery: Un almacén de datos empresarial que te ayuda a administrar y analizar tus datos con funciones integradas como el análisis geoespacial de aprendizaje automático y la inteligencia empresarial.
- AlloyDB para PostgreSQL: Un servicio de base de datos completamente administrado, compatible con PostgreSQL, que está diseñado para cargas de trabajo exigentes, incluido el procesamiento híbrido transaccional y analítico.
- MCP Toolbox for Databases: Es un servidor de Model Context Protocol (MCP) de código abierto que permite que los agentes de IA se conecten de forma segura a las bases de datos administrando las complejidades de las bases de datos, como la agrupación de conexiones, la autenticación y la observabilidad.
Implementación
Para implementar una muestra de esta arquitectura, usa Data Science with Multiple Agents. El repositorio proporciona dos conjuntos de datos de muestra para demostrar la flexibilidad del sistema, incluido un conjunto de datos de vuelos para el análisis operativo y un conjunto de datos de ventas de comercio electrónico para el análisis empresarial.
¿Qué sigue?
- (Video) Mira el podcast de Agent Factory sobre los agentes de IA para la ingeniería de datos y la ciencia de datos.
- (Notebook) Usa el agente de ciencia de datos en Colab Enterprise.
- Obtén más información para alojar agentes de IA en Cloud Run.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos para las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
- Para obtener más información sobre las arquitecturas de referencia, los diagramas y las prácticas recomendadas, explora Cloud Architecture Center.
Colaboradores
Autora: Samantha He | Escritora técnica
Otros colaboradores:
- Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
- Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Administrador de Ingeniería de Relaciones con Desarrolladores