Implementa un agente

Para implementar un agente en Vertex AI Agent Engine, elige entre tres métodos principales:

Implementación desde un objeto de agente: Es ideal para el desarrollo interactivo en entornos como Colab, ya que permite la implementación de objetos local_agent en la memoria. Este método funciona mejor para los agentes con estructuras que no contienen componentes complejos no serializables.
Implementación desde archivos fuente: Este método es adecuado para flujos de trabajo automatizados, como canalizaciones de CI/CD y herramientas de infraestructura como código, como Terraform, lo que permite implementaciones completamente declarativas y automatizadas. Implementa tu agente directamente desde el código fuente local y no requiere un bucket de Cloud Storage.
Implementar desde Developer Connect: Se recomienda para los proyectos que se administran en un repositorio de Git vinculado a través de Developer Connect. Este método optimiza la implementación de agentes directamente desde tu código fuente y admite de forma nativa el control de versión, la colaboración en equipo y las canalizaciones de CI/CD. Antes de usar este método, configura el vínculo a tu repositorio de Git siguiendo las instrucciones que se indican en Cómo configurar el vínculo al repositorio de Git de Developer Connect.

Para comenzar, sigue estos pasos:

Completa los requisitos previos.
(Opcional) Configura tu agente para la implementación.
Crea una instancia de AgentEngine.
(Opcional) Obtén el ID del recurso del agente.
(Opcional) Enumera las operaciones admitidas.
(Opcional) Otorga permisos al agente implementado.

También puedes usar las plantillas del paquete de inicio de agentes para la implementación.

Requisitos previos

Antes de implementar un agente, asegúrate de haber completado las siguientes tareas:

(Opcional) Configura tu agente para la implementación

Puedes realizar las siguientes configuraciones opcionales para tu agente:

Define los requisitos del paquete

Nota: Para las implementaciones desde archivos fuente, no es necesario que uses el parámetro requirements. En cambio, incluye un archivo requirements.txt directamente en tu paquete de código fuente. La ruta de acceso a este archivo se puede especificar en el parámetro requirements_file cuando crees la instancia de Agent Engine.

Proporciona el conjunto de paquetes que requiere el agente para la implementación. El conjunto de paquetes puede ser una lista de elementos que pip instalará o la ruta de acceso a un archivo que siga el formato de archivo de requisitos. Sigue las siguientes prácticas recomendadas:

Fija las versiones de tus paquetes para compilaciones reproducibles. Entre los paquetes comunes de los que debes hacer un seguimiento, se incluyen los siguientes: google-cloud-aiplatform, cloudpickle, langchain, langchain-core, langchain-google-vertexai y pydantic.
Minimiza la cantidad de dependencias en tu agente. Esto reduce la cantidad de cambios drásticos cuando actualizas tus dependencias y tu agente.

Si el agente no tiene dependencias, puedes establecer requirements en None:

requirements = None

Si el agente usa una plantilla específica del framework, debes especificar la versión del SDK que se importa (como 1.112.0) cuando desarrolles el agente.

ADK

requirements = [
    "google-cloud-aiplatform[agent_engines,adk]",
    # any other dependencies
]

A2A

requirements = [
    "google-cloud-aiplatform[agent_engines]",
    "a2a-sdk>=0.3.4"
    # any other dependencies
]

LangChain

requirements = [
    "google-cloud-aiplatform[agent_engines,langchain]",
    # any other dependencies
]

LangGraph

requirements = [
    "google-cloud-aiplatform[agent_engines,langgraph]",
    # any other dependencies
]

AG2

requirements = [
    "google-cloud-aiplatform[agent_engines,ag2]",
    # any other dependencies
]

LlamaIndex

Las siguientes instrucciones son para la canalización de preguntas de LlamaIndex:

requirements = [
    "google-cloud-aiplatform[agent_engines,llama_index]",
    # any other dependencies
]

También puedes hacer lo siguiente con el paquete requirements:

Fija o establece un límite superior para la versión de un paquete determinado (como google-cloud-aiplatform):

  requirements = [
      # See https://pypi.org/project/google-cloud-aiplatform for the latest version.
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
  ]

Agrega paquetes y restricciones adicionales:

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
      "cloudpickle==3.0", # new
  ]

Apunta a la versión de un paquete en una rama o solicitud de extracción de GitHub:

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk] @ git+https://github.com/googleapis/python-aiplatform.git@BRANCH_NAME", # new
  ]

Mantén la lista de requisitos en un archivo (como path/to/requirements.txt):
```
  requirements = "path/to/requirements.txt"
  
```
donde path/to/requirements.txt es un archivo de texto que sigue el formato de archivo de requisitos. Por ejemplo:
```
  google-cloud-aiplatform[agent_engines,adk]
  cloudpickle==3.0
  
```

Define paquetes adicionales

Nota: El parámetro extra_packages solo se usa cuando se realiza la implementación desde un objeto de agente.

Puedes incluir archivos o directorios locales que contengan archivos fuente de Python locales requeridos. En comparación con los requisitos de paquetes, esto te permite usar utilidades privadas que desarrollaste y que no están disponibles en PyPI o GitHub.

Si el agente no requiere ningún paquete adicional, puedes establecer extra_packages en None:

extra_packages = None

También puedes hacer lo siguiente con extra_packages:

Incluye un solo archivo (como agents/agent.py):

  extra_packages = ["agents/agent.py"]

Incluye el conjunto de archivos en un directorio completo (por ejemplo, agents/):

  extra_packages = ["agents"] # directory that includes agents/agent.py

Especifica binarios de Python wheel (por ejemplo, path/to/python_package.whl):

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]",
      "cloudpickle==3.0",
      "python_package.whl",  # install from the whl file that was uploaded
  ]
  extra_packages = ["path/to/python_package.whl"]  # bundle the whl file for uploading

Define las variables de entorno

Si hay variables de entorno de las que depende tu agente, puedes especificarlas en el argumento env_vars=. Si el agente no depende de ninguna variable de entorno, puedes configurarlo como None:

env_vars = None

Si usas secretos como variables de entorno con un agente configurado para usar la identidad del agente, otorga el permiso secretmanager.versions.access (incluido en el rol roles/secretmanager.secretAccessor) al agente de servicio de Vertex AI, que tiene el siguiente formato:

service-PROJECT_NUMBER@gcp-sa-aiplatform.iam.gserviceaccount.com

La identidad del agente que configuraste se usa durante el tiempo de ejecución, pero el agente de servicio de Vertex AI se usa para recuperar secretos durante la implementación. El permiso agregado permite que el agente de servicio recupere los valores de los secretos de Secret Manager durante el proceso de implementación.

Advertencia: No debes establecer las siguientes variables de entorno: GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_QUOTA_PROJECT, GOOGLE_CLOUD_LOCATION, PORT, K_SERVICE, K_REVISION, K_CONFIGURATION y GOOGLE_APPLICATION_CREDENTIALS. Además, debes evitar el prefijo GOOGLE_CLOUD_AGENT_ENGINE para evitar conflictos de nombres con las variables de entorno de Vertex AI Agent Engine.

Para especificar las variables de entorno, tienes varias opciones disponibles:

Diccionario

env_vars = {
  "VARIABLE_1": "VALUE_1",
  "VARIABLE_2": "VALUE_2",
}
# These environment variables will become available in Vertex AI Agent Engine
# through `os.environ`, e.g.
#
#   import os
#   os.environ["VARIABLE_1"] # will have the value "VALUE_1"
#
# and
#
#   os.environ["VARIABLE_2"] # will have the value "VALUE_2"
#

Para hacer referencia a un secreto en Secret Manager y que esté disponible como una variable de entorno (por ejemplo, CLOUD_SQL_CREDENTIALS_SECRET), primero sigue las instrucciones para crear un secreto para CLOUD_SQL_CREDENTIALS_SECRET en tu proyecto antes de especificar las variables de entorno de la siguiente manera:

env_vars = {
  # ... (other environment variables and their values)
  "CLOUD_SQL_CREDENTIALS_SECRET": {"secret": SECRET_ID, "version": SECRET_VERSION_ID},
}

donde

SECRET_VERSION_ID es el ID de la versión del secreto.
SECRET_ID es el ID del secreto.

En tu código del agente, puedes hacer referencia al secreto de la siguiente manera:

secret = os.environ.get("CLOUD_SQL_CREDENTIALS_SECRET")
if secret:
  # Secrets are stored as strings, so use json.loads to parse JSON
  # payloads.
  return json.loads(secret)

Lista

env_vars = ["VARIABLE_1", "VARIABLE_2"]
# This corresponds to the following code snippet:
#
#   import os
#
#   env_vars = {
#     "VARIABLE_1": os.environ["VARIABLE_1"],
#     "VARIABLE_2": os.environ["VARIABLE_2"],
#   }

También debes seguir las instrucciones que se indican en Configura la identidad y los permisos de tu agente para otorgarle a tu agente el permiso de Secret Manager Secret Accessor (roles/secretmanager.secretAccessor).

Cómo definir controles de recursos personalizados

Puedes especificar controles de recursos de tiempo de ejecución para el agente, como la cantidad mínima y máxima de instancias de la aplicación, los límites de recursos para cada contenedor y la simultaneidad para cada contenedor.

min_instances: Es la cantidad mínima de instancias de la aplicación que se deben mantener en ejecución en todo momento, con un rango de [0, 10]. El valor predeterminado es 1.

Nota: Mientras esta función esté en versión preliminar, incluso si configuras una mayor cantidad de instancias mínimas, no se te facturará el tiempo en que un agente esté inactivo. Este comportamiento de facturación está sujeto a cambios en el futuro.
max_instances: Es la cantidad máxima de instancias de la aplicación que se pueden iniciar para controlar el aumento del tráfico, con un rango de [1, 1000]. El valor predeterminado es 100. Si se habilitan VPC-SC o PSC-I, el rango aceptable es [1, 100] por recurso de Vertex AI Agent Engine.
resource_limits: Límites de recursos para cada contenedor. Solo se admiten las claves cpu y memory. El valor predeterminado es {"cpu": "4", "memory": "4Gi"}.
- Los únicos valores admitidos para cpu son 1, 2, 4, 6 y 8. Para obtener más información, consulta Cómo configurar la asignación de CPU.
- Los únicos valores admitidos para memory son 1Gi, 2Gi, …, 32Gi.
- Para conocer la CPU requerida en diferentes valores de memoria, consulta Cómo configurar límites de memoria.
container_concurrency: Es la simultaneidad para cada contenedor y servidor de agentes. El valor recomendado es 2 × cpu + 1. El valor predeterminado es 9.

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "min_instances": 1,
        "max_instances": 10,
        "resource_limits": {"cpu": "4", "memory": "8Gi"},
        "container_concurrency": 9,
        # ... other configs
    }
)

Para conocer las prácticas recomendadas para optimizar los recursos del entorno de ejecución, consulta Cómo optimizar y escalar el entorno de ejecución de Vertex AI Agent Engine.

Define opciones de compilación

Puedes especificar opciones de compilación para el agente, como secuencias de comandos de instalación que se ejecutan cuando se compila la imagen de contenedor del agente. Esto es útil para instalar dependencias del sistema (por ejemplo, gcloud cli, npx) o cualquier otra configuración personalizada. Las secuencias de comandos se ejecutan con permisos de administrador.

Para usar secuencias de comandos de instalación, crea un directorio llamado installation_scripts y coloca tus secuencias de comandos de shell dentro de él:

.
├── ...
└── installation_scripts/
    └── install.sh

A continuación, especifica el directorio installation_scripts en extra_packages y las rutas de acceso de la secuencia de comandos en build_options:

extra_packages = [..., "installation_scripts/install.sh"]
build_options = {"installation_scripts": ["installation_scripts/install.sh"]}

Puedes usar una de las siguientes secuencias de comandos de instalación comunes:

install_npx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "--- Installing System-Wide Node.js v20.x ---"

# 1. Install prerequisites
apt-get update
apt-get install -y ca-certificates curl gnupg

# 2. Add the NodeSource repository GPG key
mkdir -p /etc/apt/keyrings
curl -fsSL https://deb.nodesource.com/gpgkey/nodesource-repo.gpg.key | gpg --dearmor -o /etc/apt/keyrings/nodesource.gpg

# 3. Add the NodeSource repository for Node.js v20
NODE_MAJOR=20
echo "deb [signed-by=/etc/apt/keyrings/nodesource.gpg] https://deb.nodesource.com/node_$NODE_MAJOR.x nodistro main" | tee /etc/apt/sources.list.d/nodesource.list

# 4. Update package lists again and install Node.js
apt-get update
apt-get install nodejs -y

echo "--- System-wide Node.js installation complete ---"
echo "Verifying versions:"

# These commands will now work for ANY user because node and npx
# are installed in /usr/bin/ which is in everyone's default PATH.
node -v
npm -v
npx -v

install_uvx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "Starting setup..."

# Install uv
apt-get update
apt-get install -y curl
curl -LsSf https://astral.sh/uv/install.sh | env UV_INSTALL_DIR="/usr/local/bin" sh

# These commands will now work for ANY user because uv and uvx
# are installed in /usr/local/bin/ which is in everyone's default PATH.
uv --version
uvx --version

install_gcloud_cli.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

apt-get install -y curl gpg
curl https://packages.cloud.google.com/apt/doc/apt-key.gpg | gpg --dearmor -o /usr/share/keyrings/cloud.google.gpg
echo "deb [signed-by=/usr/share/keyrings/cloud.google.gpg] https://packages.cloud.google.com/apt cloud-sdk main" | tee -a /etc/apt/sources.list.d/google-cloud-sdk.list
apt-get update -y && apt-get install google-cloud-cli -y

gcloud --version

Define el framework del agente

Puedes especificar el framework de agentes que usa tu agente:

agent_framework = "google-adk"

Los siguientes son los valores admitidos:

Si no se especifica agent_framework, el valor se detecta automáticamente si realizas la implementación desde un objeto de agente. Si realizas la implementación desde archivos fuente, agent_framework se establece de forma predeterminada en "custom".

Define una carpeta de Cloud Storage

Nota: El parámetro gcs_dir_name solo se usa cuando se realiza la implementación desde un objeto de agente.

Los artefactos de la etapa de pruebas se reemplazan si corresponden a una carpeta existente en un bucket de Cloud Storage. Si es necesario, puedes especificar la carpeta de Cloud Storage para los artefactos de etapa de pruebas. Puedes configurar gcs_dir_name como None si no te importa sobrescribir los archivos de la carpeta predeterminada:

gcs_dir_name = None

Para evitar sobrescribir los archivos (por ejemplo, para diferentes entornos, como desarrollo, etapa de pruebas y producción), puedes configurar la carpeta correspondiente y especificar la carpeta en la que se almacenará el artefacto:

gcs_dir_name = "dev" # or "staging" or "prod"

Si quieres o necesitas evitar colisiones, puedes generar un uuid aleatorio:

import uuid
gcs_dir_name = str(uuid.uuid4())

Define el nombre visible

Puedes establecer el nombre visible del recurso ReasoningEngine de la siguiente manera:

display_name = "Currency Exchange Rate Agent (Staging)"

Define la descripción

Puedes establecer la descripción del recurso ReasoningEngine:

description = """
An agent that has access to tools for looking up the exchange rate.

If you run into any issues, please contact the dev team.
"""

Define las etiquetas

Puedes establecer las etiquetas del recurso ReasoningEngine como un diccionario de pares clave-valor de cadenas. A continuación, se muestra un ejemplo:

labels = {"author": "username", "version": "latest"}

Configura una identidad de agente predeterminada

Puedes aprovisionar los agentes que implementes en Vertex AI Agent Engine con una identidad única cuando crees tu agente. La identidad está vinculada al ID del recurso del agente de Vertex AI Agent Engine y es independiente del framework de agentes que usaste para desarrollar el agente:

identity_type=AGENT_IDENTITY

Para obtener más información, consulta Crea un agente con identidad de agente.

Configura una cuenta de servicio personalizada

Puedes configurar una cuenta de servicio personalizada como la identidad de tu agente implementado, en lugar de la identidad del agente o la identidad predeterminada.

Para ello, especifica el correo electrónico de tu cuenta de servicio personalizada como service_account cuando crees o actualices la instancia de Agent Engine, por ejemplo:

# Create a new instance
client.agent_engines.create(
    agent=local_agent,
    config={
        "service_account": "my-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

# Update an existing instance
resource_name = "projects/{project_id}/locations/{location}/reasoningEngines/{reasoning_engine_id}"
client.agent_engines.update(
    name=resource_name,
    agent=local_agent,
    config={
        "service_account": "my-new-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

Nota: Especifica solo el correo electrónico de la cuenta de servicio, no el URI completo del recurso, como projects/{project_id}/serviceAccounts/{service_account_email}.

Configura la interfaz de Private Service Connect

Si tienes configurada la interfaz de Private Service Connect y el intercambio de tráfico de DNS, puedes especificar tu adjunto de red y el intercambio de tráfico de DNS privado cuando implementes tu agente:

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "psc_interface_config": {
            "network_attachment": "NETWORK_ATTACHMENT",
            "dns_peering_configs": [
                {
                    "domain": "DOMAIN_SUFFIX",
                    "target_project": "TARGET_PROJECT",
                    "target_network": "TARGET_NETWORK",
                },
            ],
        },
    },
)

donde

NETWORK_ATTACHMENT es el nombre o la ruta de acceso completa de tu adjunto de red. Si la vinculación de red se crea en un proyecto (como el proyecto host de VPC compartida) diferente de aquel en el que usas Agent Engine, debes pasar la ruta de acceso completa de la vinculación de red.
DOMAIN_SUFFIX es el nombre de DNS de la zona privada de Cloud DNS que creaste cuando configuraste el intercambio de tráfico de DNS privado.
TARGET_PROJECT es el proyecto que aloja la red de VPC. Puede ser diferente del proyecto de Network Attachment.
TARGET_NETWORK es el nombre de la red de VPC.

Puedes configurar varios agentes para que usen un solo adjunto de red compartido o adjuntos de red únicos y dedicados. Para usar un adjunto de red compartido, proporciona el mismo adjunto de red en psc_interface_config para cada agente que crees.

Configura claves de encriptación administradas por el cliente

Puedes usar una clave personalizada para encriptar los datos en reposo de tu agente. Consulta Claves de encriptación administradas por el cliente (CMEK) de Agent Engine para obtener más detalles.

Para configurar la clave personalizada (CMEK) de tu agente, debes proporcionar el nombre del recurso de la clave al parámetro encryption_spec cuando crees la instancia de Agent Engine.

# The fully qualified key name
kms_key_name = "projects/PROJECT_ID/locations/LOCATION/keyRings/KEY_RING/cryptoKeys/KEY_NAME"

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "encryption_spec": {"kms_key_name": kms_key_name},
        # ... other parameters
    },
)

Configura el vínculo al repositorio de Git de Developer Connect

Para realizar la implementación desde un repositorio de Git con Developer Connect, sigue la documentación de Developer Connect para crear una conexión y vincularla al repositorio específico. El nombre del recurso del vínculo se usa como git_repository_link durante la implementación y sigue el formato projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID.

Crea una instancia de `AgentEngine`

En esta sección, se describe cómo crear una instancia de AgentEngine para implementar un agente.

Para implementar un agente en Vertex AI Agent Engine, puedes elegir entre los siguientes métodos:

Implementación desde un objeto de agente para el desarrollo interactivo.
Implementación desde Developer Connect para flujos de trabajo basados en Git
Implementación desde archivos fuente para flujos de trabajo automatizados basados en archivos

Desde un objeto de agente

Para implementar el agente en Vertex AI, usa client.agent_engines.create para pasar el objeto local_agent junto con cualquier configuración opcional:

remote_agent = client.agent_engines.create(
    agent=local_agent,                                  # Optional.
    config={
        "requirements": requirements,                   # Optional.
        "extra_packages": extra_packages,               # Optional.
        "gcs_dir_name": gcs_dir_name,                   # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

Deployment tarda unos minutos, durante los cuales se realizan los siguientes pasos en segundo plano:

Se genera un paquete de los siguientes artefactos de forma local:
- *.pkl un archivo pickle correspondiente a local_agent.
- requirements.txt, un archivo de texto que contiene los requisitos del paquete
- dependencies.tar.gz un archivo tar que contiene paquetes adicionales.
El paquete se sube a Cloud Storage (en la carpeta correspondiente) para organizar los artefactos.
Los URIs de Cloud Storage para los artefactos respectivos se especifican en PackageSpec.
El servicio Vertex AI Agent Engine recibe la solicitud, crea contenedores y activa servidores HTTP en el backend.

Desde Developer Connect

Para realizar la implementación desde Developer Connect en Vertex AI, usa client.agent_engines.create proporcionando developer_connect_source, entrypoint_module y entrypoint_object en el diccionario de configuración, junto con otras configuraciones opcionales. Este método te permite implementar código directamente desde un repositorio de Git conectado.

remote_agent = client.agent_engines.create(
    config={
        "developer_connect_source": {                   # Required.
            "git_repository_link": "projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID",
            "revision": "main",
            "dir": "path/to/dir",
        },
        "entrypoint_module": "agent",                   # Required.
        "entrypoint_object": "root_agent",              # Required.
        "requirements_file": "requirements.txt",        # Optional.
        # Other optional configs:
        # "env_vars": {...},
        # "service_account": "...",
    },
)

Los parámetros para la implementación de Developer Connect son los siguientes:

developer_connect_source (obligatorio, dict): Es la configuración para recuperar el código fuente. Consulta cómo configurar el vínculo al repositorio de Git de Developer Connect para obtener más detalles.
- git_repository_link (obligatorio, str): Es el nombre del recurso del vínculo del repositorio de Git de Developer Connect.
- revision (obligatorio, str): Es la revisión que se recuperará (rama, etiqueta o SHA de confirmación).
- dir (obligatorio, str): Es el directorio raíz del código del agente dentro del repositorio.
entrypoint_module (obligatorio, str): Es el nombre del módulo de Python que contiene el punto de entrada del agente, en relación con el directorio especificado en developer_connect_source.dir.
entrypoint_object (obligatorio, str): Es el nombre del objeto invocable dentro de entrypoint_module que representa la aplicación del agente (por ejemplo, root_agent).
requirements_file (opcional, str): Es la ruta de acceso a un archivo de requisitos de pip en relación con la raíz de la fuente. La configuración predeterminada es requirements.txt.

Deployment tarda unos minutos, durante los cuales se realizan los siguientes pasos en segundo plano:

El servicio de Vertex AI Agent Engine recupera el código fuente de la revisión del repositorio de Git especificada.
El servicio instala dependencias de requirements_file (si se proporciona).
El servicio inicia la aplicación del agente con los parámetros entrypoint_module y entrypoint_object especificados.

Desde archivos de origen

Para realizar la implementación desde archivos fuente en Vertex AI, usa client.agent_engines.create proporcionando source_packages, entrypoint_module, entrypoint_object y class_methods en el diccionario de configuración, junto con otras configuraciones opcionales. Con este método, no es necesario que pases un objeto de agente ni un bucket de Cloud Storage.

remote_agent = client.agent_engines.create(
    config={
        "source_packages": source_packages,             # Required.
        "entrypoint_module": entrypoint_module,         # Required.
        "entrypoint_object": entrypoint_object,         # Required.
        "class_methods": class_methods,                 # Required.
        "requirements_file": requirements_file,         # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

Los parámetros para la implementación de la fuente intercalada son los siguientes:

source_packages (obligatorio, list[str]): Es una lista de rutas de acceso a archivos o directorios locales que se incluirán en la implementación. El tamaño total de los archivos y directorios en source_packages no debe superar los 8 MB.
entrypoint_module (obligatorio, str): Es el nombre completo del módulo de Python que contiene el punto de entrada del agente (por ejemplo, agent_dir.agent).
entrypoint_object (obligatorio, str): Es el nombre del objeto invocable dentro de entrypoint_module que representa la aplicación del agente (por ejemplo, root_agent).

class_methods (obligatorio, list[dict]): Es una lista de diccionarios que definen los métodos expuestos del agente. Cada diccionario incluye un campo name (obligatorio), un campo api_mode (obligatorio) y un campo parameters. Consulta List supported operations para obtener más información sobre los métodos de un agente personalizado.

Por ejemplo:

  "class_methods": [
      {
          "name": "method_name",
          "api_mode": "", # Possible options are: "", "async", "async_stream", "stream", "bidi_stream"
          "parameters": {
              "type": "object",
              "properties": {
                  "param1": {"type": "string", "description": "Description of param1"},
                  "param2": {"type": "integer"}
              },
              "required": ["param1"]
          }
      }
  ]
  ```

requirements_file (opcional, str): Es la ruta de acceso a un archivo de requisitos de pip dentro de las rutas de acceso especificadas en source_packages. El valor predeterminado es requirements.txt en el directorio raíz de la fuente empaquetada.

Deployment tarda unos minutos, durante los cuales se realizan los siguientes pasos en segundo plano:

El SDK de Vertex AI crea un archivo tar.gz de las rutas de acceso especificadas en source_packages.
Este archivo se codifica y se envía directamente a la API de Vertex AI.
El servicio de Vertex AI Agent Engine recibe el archivo, lo extrae, instala las dependencias de requirements_file (si se proporciona) y, luego, inicia la aplicación del agente con los parámetros entrypoint_module y entrypoint_object especificados.

A continuación, se muestra un ejemplo de cómo implementar un agente a partir de archivos fuente:

from google.cloud.aiplatform import vertexai

# Example file structure:
# /agent_directory
#     ├── agent.py
#     ├── requirements.txt

# Example agent_directory/agent.py:
# class MyAgent:
#     def ask(self, question: str) -> str:
#         return f"Answer to {question}"
# root_agent = MyAgent()

remote_agent = client.agent_engines.create(
  config={
      "display_name": "My Agent",
      "description": "An agent deployed from a local source.",
      "source_packages": ["agent_directory"],
      "entrypoint_module": "agent_directory.agent",
      "entrypoint_object": "root_agent",
      "requirements_file": "requirements.txt",
      "class_methods": [
          {"name": "ask", "api_mode": "", "parameters": {
              "type": "object",
              "properties": {
                  "question": {"type": "string"}
              },
              "required": ["question"]
          }},
      ],
      # Other optional configs:
      # "env_vars": {...},
      # "service_account": "...",
  }
)

La latencia de la Deployment depende del tiempo total que lleva instalar los paquetes requeridos. Una vez implementado, remote_agent corresponde a una instancia de local_agent que se ejecuta en Vertex AI y que se puede consultar o borrar.

El objeto remote_agent corresponde a una clase AgentEngine que contiene lo siguiente:

remote_agent.api_resource con información sobre el agente implementado. También puedes llamar a remote_agent.operation_schemas() para que muestre la lista de operaciones que admite remote_agent. Consulta Operaciones admitidas para obtener más detalles.
remote_agent.api_client que permite interacciones de servicio síncronas
remote_agent.async_api_client que permite interacciones de servicio asíncronas

(Opcional) Obtén el ID del recurso del agente

Cada agente implementado tiene un identificador único. Puedes ejecutar el siguiente comando para obtener el nombre del recurso de tu agente implementado:

remote_agent.api_resource.name

La respuesta debería verse como la siguiente cadena:

"projects/PROJECT_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"

donde

PROJECT_ID es el Google Cloud ID del proyecto en el que se ejecuta el agente implementado.
LOCATION es la región en la que se ejecuta el agente implementado.
RESOURCE_ID es el ID del agente implementado como un recurso reasoningEngine.

(Opcional) Enumera las operaciones admitidas

Cada agente implementado tiene una lista de operaciones admitidas. Puedes usar AgentEngine.operation_schemas para obtener la lista de operaciones admitidas por el agente implementado:

remote_agent.operation_schemas()

El esquema de cada operación es un diccionario que documenta la información de un método para el agente al que puedes llamar. El conjunto de operaciones admitidas depende del framework que usaste para desarrollar tu agente:

Otorga permisos al agente implementado (opcional)

Si el agente implementado necesita permisos adicionales, sigue las instrucciones que se indican en Cómo configurar la identidad y los permisos de tu agente.

Implementa un agente Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Requisitos previos

(Opcional) Configura tu agente para la implementación

Define los requisitos del paquete

ADK

A2A

LangChain

LangGraph

AG2

LlamaIndex

Define paquetes adicionales

Define las variables de entorno

Diccionario

Lista

Cómo definir controles de recursos personalizados

Define opciones de compilación

install_npx.sh

install_uvx.sh

install_gcloud_cli.sh

Define el framework del agente

Define una carpeta de Cloud Storage

Define el nombre visible

Define la descripción

Define las etiquetas

Configura una identidad de agente predeterminada

Configura una cuenta de servicio personalizada

Configura la interfaz de Private Service Connect

Configura claves de encriptación administradas por el cliente

Configura el vínculo al repositorio de Git de Developer Connect

Crea una instancia de AgentEngine

Desde un objeto de agente

Desde Developer Connect

Desde archivos de origen

(Opcional) Obtén el ID del recurso del agente

(Opcional) Enumera las operaciones admitidas

Otorga permisos al agente implementado (opcional)

¿Qué sigue?

Implementa un agente

Crea una instancia de `AgentEngine`