Este documento descreve uma arquitetura de alto nível para uma aplicação que gera e administra um questionário de aprendizagem interativo com um fluxo de trabalho de IA de agente. O agente avalia os conhecimentos de um utilizador sobre um tópico específico e usa um estado de sessão persistente e uma memória a longo prazo para criar uma experiência personalizada. O agente mantém um histórico das respostas do utilizador, o que lhe permite ajustar dinamicamente a dificuldade e o conteúdo das perguntas subsequentes.
O público-alvo deste documento inclui arquitetos, programadores e administradores que criam e gerem aplicações de IA autónoma. Esta arquitetura é adaptável para criar aplicações educativas interativas e com estado em vários setores. O documento pressupõe uma compreensão básica dos sistemas de agentes de IA. Para informações sobre a diferença entre os agentes e os sistemas não baseados em agentes, consulte o artigo Qual é a diferença entre agentes de IA, assistentes de IA e bots?
A secção de implementação deste documento fornece links para exemplos de código que ajudam a experimentar a implementação de uma aplicação de IA autónoma que executa um fluxo de trabalho de ciência de dados.
Arquitetura
O diagrama seguinte mostra uma arquitetura de alto nível para um agente de aprendizagem interativo.
A arquitetura mostra o seguinte fluxo de dados:
- Um utilizador realiza uma ação, como iniciar um questionário ou enviar uma resposta, na aplicação de questionários alojada no Cloud Run.
- A aplicação encaminha a introdução do utilizador para o agente de IA.
O agente de IA usa o modelo Gemini na Vertex AI para interpretar a entrada do utilizador. Com base no pedido do utilizador, o agente chama as ferramentas adequadas para realizar a ação de questionário pedida.
Por exemplo, o agente seleciona uma ferramenta para iniciar uma sessão de questionário, avaliar uma resposta ou gerar a pergunta seguinte.
O agente envia a resposta à aplicação de questionários.
A aplicação de questionários encaminha a resposta para o utilizador.
Para manter o estado do questionário e personalizar a experiência, o agente executa as seguintes tarefas em segundo plano:
- A app do agente anexa o progresso e a pontuação mais recentes do questionário ao histórico da sessão guardada que está armazenada em Sessões do Vertex AI Agent Engine.
- O agente transforma os dados dos questionários em memórias e armazena-os no Memory Bank para memorização a longo prazo. O agente usa os dados históricos armazenados na memória para gerar respostas com reconhecimento do contexto em sessões futuras.
Produtos usados
Esta arquitetura de exemplo usa os seguintes Google Cloud produtos:
- Cloud Run: uma plataforma de computação sem servidor que lhe permite executar contentores diretamente na infraestrutura escalável da Google.
- Agent Development Kit (ADK): um conjunto de ferramentas e bibliotecas para desenvolver, testar e implementar agentes de IA.
- Vertex AI: uma plataforma de ML que lhe permite preparar e implementar modelos de ML e aplicações de IA, bem como personalizar MDIs/CEs para utilização em aplicações com tecnologia de IA.
- Sessões do Agent Engine da Vertex AI: um serviço de armazenamento persistente que guarda e obtém o histórico de interações entre um utilizador e os agentes.
- Banco de memória: um serviço de armazenamento persistente que gera, refina, gere e obtém memórias a longo prazo com base nas conversas de um utilizador com um agente.
Implementação
Para implementar um exemplo desta arquitetura que forneça questionários relacionados com programação, use o exemplo de código do tutor de Python disponível no GitHub.
O que se segue?
- (Notebook) Comece a usar sessões e o banco de memória para agentes do ADK no Cloud Run.
- (Blogue) Saiba mais sobre o estado e a memória com o ADK.
- (Codelab) Crie um assistente de revisão de código de IA de produção com o ADK.
- (Vídeo) Veja o podcast Agent Factory sobre a memória nos agentes.
- Saiba como alojar agentes de IA no Cloud Run.
- Para uma vista geral dos princípios e recomendações de arquitetura específicos das cargas de trabalho de IA e ML no Google Cloud, consulte a perspetiva de IA e ML no Well-Architected Framework.
- Para ver mais arquiteturas de referência, diagramas e práticas recomendadas, explore o Centro de arquitetura na nuvem.
Colaboradores
Autor: Samantha He | Redator técnico
Outros colaboradores:
- Amina Mansour | Head of Cloud Platform Evaluations Team
- Kumar Dhanagopal | Cross-Product Solution Developer
- Megan O'Keefe | Consultora de programadores
- Rachael Deacon-Smith | Consultora de programadores
- Shir Meir Lador | Developer Relations Engineering Manager