En esta guía se ofrece un resumen sobre cómo alojar agentes de Agent2Agent (A2A) en Cloud Run.
Para obtener una introducción a los conceptos de A2A, consulta Conceptos clave de A2A.
Relación entre los agentes de IA y el protocolo A2A
Los agentes de IA son programas de software que pueden percibir su entorno, tomar decisiones y llevar a cabo acciones autónomas para alcanzar objetivos específicos. Estos agentes son cada vez más sofisticados y suelen utilizar modelos de lenguaje extensos (LLMs) para tareas complejas, como razonar, planificar e interactuar en lenguaje natural.
A medida que se desarrollen más agentes de IA especializados, será esencial que se comuniquen y colaboren entre sí. El protocolo Agent2Agent (A2A) es un estándar abierto diseñado para permitir la comunicación y la interoperabilidad fluidas y seguras entre agentes de IA, aunque se hayan creado con frameworks diferentes, por distintos proveedores o se ejecuten en servidores independientes. A2A permite que los agentes trabajen juntos como iguales sin exponer su estado o lógica internos.
En el siguiente diagrama se muestra la arquitectura de un sistema de agente A2A, donde se ve un cliente A2A (usuario o agente) interactuando con el agente A2A:
El núcleo del agente A2A es una capa de servicio y orquestación, como Cloud Run. Esta capa gestiona las interacciones con modelos de IA como Gemini y Vertex AI, almacenamientos de memoria como AlloyDB y A2A TaskStore, y herramientas externas a través de APIs. Los clientes interactúan con el agente enviando solicitudes, como "Get Agent Card" (Obtener tarjeta del agente) o "send message" (Enviar mensaje), y reciben actualizaciones de las tareas.
Para obtener información sobre el ciclo de vida de las solicitudes A2A, consulta la sección Ciclo de vida de las solicitudes A2A.
Siguientes pasos
- Para conocer los pasos prácticos para desplegar tus propios agentes de A2A, consulta el artículo Crear y desplegar un agente de A2A en Cloud Run.