En este documento, se describe una arquitectura de alto nivel para una aplicación que ejecuta un flujo de trabajo de ciencia de datos para automatizar tareas complejas de análisis de datos y aprendizaje automático.
Esta arquitectura usa conjuntos de datos alojados en BigQuery o AlloyDB para PostgreSQL. La arquitectura es un sistema multiagente que permite a los usuarios ejecutar acciones en comandos de lenguaje natural y elimina la necesidad de escribir código complejo de SQL o Python.
El público previsto para este documento incluye arquitectos, desarrolladores y administradores que crean y administran aplicaciones de IA con agentes. Esta arquitectura permite que los equipos de datos y empresariales analicen métricas en una amplia variedad de industrias, como el comercio minorista, las finanzas y la fabricación. En el documento, se supone que tienes conocimientos básicos de los sistemas de IA de agentes. Para obtener información sobre cómo difieren los agentes de los sistemas sin agentes, consulta ¿Cuál es la diferencia entre agentes de IA, asistentes de IA y bots?
En la sección de implementación de este documento, se proporcionan vínculos a muestras de código para ayudarte a experimentar con la implementación de una aplicación de IA con agentes que ejecuta un flujo de trabajo de ciencia de datos.
Arquitectura
En el siguiente diagrama, se muestra la arquitectura de un agente de flujo de trabajo de ciencia de datos.
Esta arquitectura incluye los siguientes componentes:
| Componente | Descripción |
|---|---|
| Frontend | Los usuarios interactúan con el sistema multiagente a través de un frontend, como una interfaz de chat, que se ejecuta como un servicio de Cloud Run sin servidores. |
| Agentes | Esta arquitectura usa los siguientes agentes:
|
| Entorno de ejecución de agentes | Los agentes de IA de esta arquitectura se implementan como servicios de Cloud Run sin servidores. |
| ADK | ADK proporciona herramientas y un framework para desarrollar, probar y, luego, implementar agentes. ADK abstrae la complejidad de la creación de agentes y permite que los desarrolladores de IA se enfoquen en la lógica y las capacidades del agente. |
| Modelo de IA y entornos de ejecución de modelos | Para la entrega de inferencias, los agentes en esta arquitectura de ejemplo usan el modelo de Gemini más reciente en Vertex AI. |
Productos usados
En esta arquitectura de ejemplo, se usan los siguientes Google Cloud productos y herramientas de código abierto:
- Cloud Run: Una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
- Kit de desarrollo de agentes (ADK): Es un conjunto de herramientas y bibliotecas para desarrollar, probar y, luego, implementar agentes de IA.
- Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
- Gemini: Es una familia de modelos de IA multimodales desarrollados por Google.
- BigQuery: Un almacén de datos empresarial que te ayuda a administrar y analizar tus datos con funciones integradas como el análisis geoespacial de aprendizaje automático y la inteligencia empresarial.
- AlloyDB para PostgreSQL: Un servicio de base de datos completamente administrado, compatible con PostgreSQL, que está diseñado para cargas de trabajo exigentes, incluido el procesamiento híbrido transaccional y analítico.
- MCP Toolbox para bases de datos: Es un servidor de Protocolo de contexto de modelo (MCP) de código abierto que permite que los agentes de IA se conecten de forma segura a las bases de datos mediante la administración de complejidades de la base de datos, como el agrupamiento de conexiones, la autenticación y la observabilidad.
Deployment
Para implementar una implementación de muestra de esta arquitectura, usa Ciencia de datos con varios agentes. El repositorio proporciona dos conjuntos de datos de muestra para demostrar la flexibilidad del sistema, incluido un conjunto de datos de vuelos para el análisis operativo y un conjunto de datos de ventas de comercio electrónico para el análisis empresarial.
¿Qué sigue?
- (Video) Mira el podcast de Agent Factory sobre agentes de IA para la ingeniería de datos y la ciencia de datos.
- (Notebook) Usa el agente de ciencia de datos en Colab Enterprise.
- Obtén información para alojar agentes de IA en Cloud Run.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura que son específicos de las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
- Para obtener más información sobre las arquitecturas de referencia, los diagramas y las prácticas recomendadas, explora el Cloud Architecture Center.
Colaboradores
Autor: Samantha He | Escritora técnica
Otros colaboradores:
- Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
- Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Administrador de ingeniería de relaciones con desarrolladores