En este documento se describe una arquitectura de alto nivel para una aplicación que genera y administra un cuestionario de aprendizaje interactivo con un flujo de trabajo de IA de agente. El agente evalúa los conocimientos de un usuario sobre un tema específico y usa un estado de sesión persistente y una memoria a largo plazo para crear una experiencia personalizada. El agente mantiene un historial de las respuestas del usuario, lo que le permite ajustar de forma dinámica la dificultad y el contenido de las preguntas posteriores.
Este documento está dirigido a arquitectos, desarrolladores y administradores que crean y gestionan aplicaciones de IA basadas en agentes. Esta arquitectura se puede adaptar para crear aplicaciones educativas interactivas y con estado en diversos sectores. En este documento se presupone que el lector tiene conocimientos básicos sobre los sistemas de agentes de IA. Para obtener información sobre las diferencias entre los agentes y los sistemas sin agentes, consulta ¿En qué se diferencian los agentes, los asistentes y los bots de IA?
En la sección Despliegue de este documento se proporcionan enlaces a ejemplos de código para ayudarte a experimentar con el despliegue de una aplicación de IA con agentes que ejecute un flujo de trabajo de ciencia de datos.
Arquitectura
En el siguiente diagrama se muestra una arquitectura general de un agente de aprendizaje interactivo.
La arquitectura muestra el siguiente flujo de datos:
- Un usuario realiza una acción, como iniciar un cuestionario o enviar una respuesta, en la aplicación de cuestionarios alojada en Cloud Run.
- La aplicación reenvía la entrada del usuario al agente de IA.
El agente de IA usa el modelo de Gemini en Vertex AI para interpretar la entrada del usuario. En función de la solicitud del usuario, el agente llama a las herramientas adecuadas para realizar la acción del cuestionario solicitada.
Por ejemplo, el agente selecciona una herramienta para iniciar una sesión de cuestionario, evaluar una respuesta o generar la siguiente pregunta.
El agente envía la respuesta a la aplicación del cuestionario.
La aplicación del cuestionario reenvía la respuesta al usuario.
Para mantener el estado del cuestionario y personalizar la experiencia, el agente realiza las siguientes tareas en segundo plano:
- El agente añade el progreso y la puntuación más recientes del cuestionario al historial de la sesión guardada que se almacena en Vertex AI Agent Engine Sessions.
- El agente transforma los datos del cuestionario en recuerdos y los almacena en el banco de recuerdos para poder recuperarlos a largo plazo. El agente usa el historial de datos almacenado en la memoria para generar respuestas contextuales en sesiones futuras.
Productos usados
Esta arquitectura de ejemplo usa los siguientes productos de Google Cloud :
- Cloud Run: una plataforma de computación sin servidor que te permite ejecutar contenedores directamente en la infraestructura escalable de Google.
- Agent Development Kit (ADK): un conjunto de herramientas y bibliotecas para desarrollar, probar y desplegar agentes de IA.
- Vertex AI: una plataforma de aprendizaje automático que te permite entrenar y desplegar modelos de aprendizaje automático y aplicaciones de IA, así como personalizar LLMs para usarlos en aplicaciones basadas en IA.
- Sesiones de Vertex AI Agent Engine: un servicio de almacenamiento persistente que guarda y recupera el historial de interacciones entre un usuario y los agentes.
- Banco de memoria: un servicio de almacenamiento persistente que genera, perfecciona, gestiona y recupera recuerdos a largo plazo basados en las conversaciones de un usuario con un agente.
Implementación
Para implementar un ejemplo de esta arquitectura que proporcione cuestionarios relacionados con la programación, usa el ejemplo de código de tutor de Python, disponible en GitHub.
Siguientes pasos
- (Notebook) Empieza a usar Sesiones y Memory Bank para agentes de ADK en Cloud Run.
- (Blog) Consulta más información sobre el estado y la memoria con el ADK.
- (Codelab) Crea un asistente de revisión de código de IA para producción con ADK.
- (Vídeo) Pódcast de Agent Factory sobre la memoria de los agentes
- Consulta información sobre cómo alojar agentes de IA en Cloud Run.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos de las cargas de trabajo de IA y aprendizaje automático en Google Cloud, consulta la sección Perspectiva de IA y aprendizaje automático del framework Well-Architected.
- Para ver más arquitecturas de referencia, diagramas y prácticas recomendadas, consulta el centro de arquitectura de Cloud.
Colaboradores
Autor: Samantha He | Redactora técnica
Otros colaboradores:
- Amina Mansour | Responsable del equipo de evaluaciones de Cloud Platform
- Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Gestora de Ingeniería de Relaciones con Desarrolladores