En este documento, se describe una arquitectura de alto nivel para una aplicación que genera y administra un cuestionario de aprendizaje interactivo con un flujo de trabajo de IA basado en agentes. El agente evalúa el conocimiento de un usuario sobre un tema específico y usa un estado de sesión persistente y memoria a largo plazo para crear una experiencia personalizada. El agente mantiene un historial de las respuestas del usuario, lo que le permite ajustar de forma dinámica la dificultad y el contenido de las preguntas posteriores.
El público previsto para este documento incluye arquitectos, desarrolladores y administradores que compilan y administran aplicaciones de IA basadas en agentes. Esta arquitectura se puede adaptar para crear aplicaciones educativas interactivas y con estado en diversas industrias. En este documento, se supone que tienes conocimientos básicos sobre los sistemas de agentes basados en IA. Para obtener información sobre cómo se diferencian los agentes de los sistemas no basados en agentes, consulta ¿Cuál es la diferencia entre agentes de IA, asistentes de IA y bots?
En la sección Implementación de este documento, se proporcionan vínculos a muestras de código para ayudarte a experimentar con la implementación de una aplicación de IA basada en agentes que ejecuta un flujo de trabajo de ciencia de datos.
Arquitectura
En el siguiente diagrama, se muestra una arquitectura de alto nivel para un agente de aprendizaje interactivo.
La arquitectura muestra el siguiente flujo de datos:
- Un usuario realiza una acción, como iniciar un cuestionario o enviar una respuesta, en la aplicación de cuestionario alojada en Cloud Run.
- La aplicación reenvía la entrada del usuario al agente de IA.
El agente de IA usa el modelo de Gemini en Vertex AI para interpretar la entrada del usuario. Según la solicitud del usuario, el agente llama a las herramientas adecuadas para realizar la acción del cuestionario solicitada.
Por ejemplo, el agente selecciona una herramienta para iniciar una sesión de cuestionario, evaluar una respuesta o generar la siguiente pregunta.
El agente envía la respuesta a la aplicación del cuestionario.
La aplicación de cuestionario reenvía la respuesta al usuario.
Para mantener el estado del cuestionario y personalizar la experiencia, el agente realiza las siguientes tareas en segundo plano:
- La app del agente agrega el progreso y la puntuación más recientes del cuestionario al historial de la sesión guardada que se almacena en Vertex AI Agent Engine Sessions.
- El agente transforma los datos del cuestionario en recuerdos y los almacena en el banco de memoria para su recuperación a largo plazo. El agente usa los datos históricos almacenados en la memoria para generar respuestas basadas en el contexto en sesiones futuras.
Productos usados
En esta arquitectura de ejemplo, se usan los siguientes Google Cloud productos:
- Cloud Run es una plataforma de procesamiento administrada que te permite ejecutar contenedores directamente sobre la infraestructura escalable de Google.
- Kit de desarrollo de agentes (ADK): Es un conjunto de herramientas y bibliotecas para desarrollar, probar e implementar agentes de IA.
- Vertex AI: Es una plataforma de AA que te permite entrenar y, también, implementar modelos de AA y aplicaciones de IA, y personalizar LLM para usarlos en aplicaciones impulsadas por IA.
- Sesiones de Vertex AI Agent Engine: Es un servicio de almacenamiento persistente que guarda y recupera el historial de interacciones entre un usuario y los agentes.
- Banco de memoria: Es un servicio de almacenamiento persistente que genera, perfecciona, administra y recupera recuerdos a largo plazo basados en las conversaciones de un usuario con un agente.
Implementación
Para implementar una muestra de esta arquitectura que proporcione cuestionarios relacionados con la programación, usa el código de muestra del tutor de Python que está disponible en GitHub.
¿Qué sigue?
- (Notebook) Comienza a usar sesiones y Memory Bank para agentes de ADK en Cloud Run.
- (Blog) Obtén más información sobre el estado y la memoria con el ADK.
- (Codelab) Crea un asistente de revisión de código de IA para producción con el ADK.
- (Video) Mira el podcast de Agent Factory sobre la memoria en los agentes.
- Obtén más información para alojar agentes de IA en Cloud Run.
- Para obtener una descripción general de los principios y las recomendaciones de arquitectura específicos para las cargas de trabajo de IA y AA en Google Cloud, consulta la perspectiva de IA y AA en Well-Architected Framework.
- Para obtener más información sobre las arquitecturas de referencia, los diagramas y las prácticas recomendadas, explora Cloud Architecture Center.
Colaboradores
Autora: Samantha He | Escritora técnica
Otros colaboradores:
- Amina Mansour | Jefa del equipo de evaluaciones de Cloud Platform
- Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
- Megan O'Keefe | Developer Advocate
- Rachael Deacon-Smith | Developer Advocate
- Shir Meir Lador | Administrador de Ingeniería de Relaciones con Desarrolladores