Esegui il deployment di un agente

Per eseguire il deployment di un agente su Vertex AI Agent Engine, scegli tra tre metodi principali:

Deployment da un oggetto agente: ideale per lo sviluppo interattivo in ambienti come Colab, che consente il deployment di oggetti local_agent in memoria. Questo metodo è più adatto agli agenti con strutture che non contengono componenti complessi e non serializzabili.
Deployment dai file sorgente: questo metodo è ideale per i workflow automatizzati come le pipeline CI/CD e gli strumenti Infrastructure as Code come Terraform, consentendo deployment completamente dichiarativi e automatizzati. Esegue il deployment dell'agente direttamente dal codice sorgente locale e non richiede un bucket Cloud Storage.
Esegui il deployment da Developer Connect: consigliato per i progetti gestiti in un repository Git collegato tramite Developer Connect. Questo metodo semplifica il deployment degli agenti direttamente dal codice sorgente e supporta in modo nativo il controllo delle versioni, la collaborazione del team e le pipeline CI/CD. Prima di utilizzare questo metodo, configura il link al repository Git seguendo le istruzioni riportate in Configurare il link al repository Git di Developer Connect.

Per iniziare:

Completa i prerequisiti.
(Facoltativo) Configura l'agente per il deployment.
Crea un'istanza AgentEngine.
(Facoltativo) Ottieni l'ID risorsa dell'agente.
(Facoltativo) Elenca le operazioni supportate.
(Facoltativo) Concedi le autorizzazioni all'agente di cui è stato eseguito il deployment.

Puoi anche utilizzare i modelli dello starter pack dell'agente per il deployment.

Prerequisiti

Prima di eseguire il deployment di un agente, assicurati di aver completato le seguenti attività:

(Facoltativo) Configura l'agente per il deployment

Puoi effettuare le seguenti configurazioni facoltative per il tuo agente:

Definisci i requisiti del pacchetto

Nota:per i deployment dai file di origine, non è necessario utilizzare il parametro requirements. Includi invece un file requirements.txt direttamente nel pacchetto di codice sorgente. Il percorso di questo file può essere specificato nel parametro requirements_file quando crei l'istanza di Agent Engine.

Fornisci l'insieme di pacchetti richiesti dall'agente per il deployment. Il set di pacchetti può essere un elenco di elementi da installare con pip o il percorso di un file che segue il formato del file Requirements. Utilizza le seguenti best practice:

Blocca le versioni dei pacchetti per build riproducibili. I pacchetti comuni da monitorare includono: google-cloud-aiplatform, cloudpickle, langchain, langchain-core, langchain-google-vertexai e pydantic.
Riduci al minimo il numero di dipendenze nell'agente. In questo modo, il numero di modifiche che causano interruzioni durante l'aggiornamento delle dipendenze e dell'agente viene ridotto.

Se l'agente non ha dipendenze, puoi impostare requirements su None:

requirements = None

Se l'agente utilizza un modello specifico del framework, devi specificare la versione dell'SDK importata (ad esempio 1.112.0) durante lo sviluppo dell'agente.

ADK

requirements = [
    "google-cloud-aiplatform[agent_engines,adk]",
    # any other dependencies
]

A2A

requirements = [
    "google-cloud-aiplatform[agent_engines]",
    "a2a-sdk>=0.3.4"
    # any other dependencies
]

LangChain

requirements = [
    "google-cloud-aiplatform[agent_engines,langchain]",
    # any other dependencies
]

LangGraph

requirements = [
    "google-cloud-aiplatform[agent_engines,langgraph]",
    # any other dependencies
]

AG2

requirements = [
    "google-cloud-aiplatform[agent_engines,ag2]",
    # any other dependencies
]

LlamaIndex

Le seguenti istruzioni sono per la pipeline di query LlamaIndex:

requirements = [
    "google-cloud-aiplatform[agent_engines,llama_index]",
    # any other dependencies
]

Con il pacchetto requirements puoi anche:

Limita o blocca la versione di un determinato pacchetto (ad esempio google-cloud-aiplatform):

  requirements = [
      # See https://pypi.org/project/google-cloud-aiplatform for the latest version.
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
  ]

Aggiungi altri pacchetti e vincoli:

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
      "cloudpickle==3.0", # new
  ]

Punta alla versione di un pacchetto su un ramo o una richiesta di pull di GitHub:

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk] @ git+https://github.com/googleapis/python-aiplatform.git@BRANCH_NAME", # new
  ]

Mantieni l'elenco dei requisiti in un file (ad esempio path/to/requirements.txt):
```
  requirements = "path/to/requirements.txt"
  
```
dove path/to/requirements.txt è un file di testo conforme al formato del file dei requisiti. Ad esempio:
```
  google-cloud-aiplatform[agent_engines,adk]
  cloudpickle==3.0
  
```

Definisci pacchetti aggiuntivi

Nota:il parametro extra_packages viene utilizzato solo durante il deployment da un oggetto agente.

Puoi includere file o directory locali che contengono i file sorgente Python locali richiesti. Rispetto ai requisiti del pacchetto, questo ti consente di utilizzare le utilità private che hai sviluppato e che altrimenti non sono disponibili su PyPI o GitHub.

Se l'agente non richiede pacchetti aggiuntivi, puoi impostare extra_packages su None:

extra_packages = None

Puoi anche fare quanto segue con extra_packages:

Includi un singolo file (ad esempio agents/agent.py):
```
  extra_packages = ["agents/agent.py"]
  
```

Includi il set di file in un'intera directory (ad esempio, agents/):

  extra_packages = ["agents"] # directory that includes agents/agent.py

Specifica i file binari wheel di Python (ad esempio, path/to/python_package.whl):

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]",
      "cloudpickle==3.0",
      "python_package.whl",  # install from the whl file that was uploaded
  ]
  extra_packages = ["path/to/python_package.whl"]  # bundle the whl file for uploading

Definisci le variabili di ambiente

Se ci sono variabili di ambiente da cui dipende il tuo agente, puoi specificarle nell'argomento env_vars=. Se l'agente non dipende da alcuna variabile di ambiente, puoi impostarlo su None:

env_vars = None

Se utilizzi i secret come variabili di ambiente con un agente configurato per utilizzare l'identità dell'agente, concedi l'autorizzazione secretmanager.versions.access (inclusa nel ruolo roles/secretmanager.secretAccessor) all'agente di servizio Vertex AI, che ha il seguente formato:

service-PROJECT_NUMBER@gcp-sa-aiplatform.iam.gserviceaccount.com

L'identità dell'agente configurata viene utilizzata in fase di runtime, ma il service agent Vertex AI viene utilizzato per recuperare i secret durante il deployment. L'autorizzazione aggiunta consente all'agente di servizio di recuperare i valori dei secret da Secret Manager durante il processo di deployment.

Avviso: non devi impostare le seguenti variabili di ambiente: GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_QUOTA_PROJECT, GOOGLE_CLOUD_LOCATION, PORT, K_SERVICE, K_REVISION, K_CONFIGURATION e GOOGLE_APPLICATION_CREDENTIALS. Inoltre, devi evitare il prefisso GOOGLE_CLOUD_AGENT_ENGINE per evitare conflitti di denominazione con le variabili di ambiente di Vertex AI Agent Engine.

Per specificare le variabili di ambiente, sono disponibili diverse opzioni:

Dizionario

env_vars = {
  "VARIABLE_1": "VALUE_1",
  "VARIABLE_2": "VALUE_2",
}
# These environment variables will become available in Vertex AI Agent Engine
# through `os.environ`, e.g.
#
#   import os
#   os.environ["VARIABLE_1"] # will have the value "VALUE_1"
#
# and
#
#   os.environ["VARIABLE_2"] # will have the value "VALUE_2"
#

Per fare riferimento a un secret in Secret Manager e renderlo disponibile come variabile di ambiente (ad esempio, CLOUD_SQL_CREDENTIALS_SECRET), segui prima le istruzioni per creare un secret per CLOUD_SQL_CREDENTIALS_SECRET nel tuo progetto, prima di specificare le variabili di ambiente come:

env_vars = {
  # ... (other environment variables and their values)
  "CLOUD_SQL_CREDENTIALS_SECRET": {"secret": SECRET_ID, "version": SECRET_VERSION_ID},
}

dove

SECRET_VERSION_ID è l'ID della versione del secret.
SECRET_ID è l'ID del secret.

Nel tuo codice agente, puoi fare riferimento al secret nel seguente modo:

secret = os.environ.get("CLOUD_SQL_CREDENTIALS_SECRET")
if secret:
  # Secrets are stored as strings, so use json.loads to parse JSON
  # payloads.
  return json.loads(secret)

Elenco

env_vars = ["VARIABLE_1", "VARIABLE_2"]
# This corresponds to the following code snippet:
#
#   import os
#
#   env_vars = {
#     "VARIABLE_1": os.environ["VARIABLE_1"],
#     "VARIABLE_2": os.environ["VARIABLE_2"],
#   }

Devi anche seguire le istruzioni riportate in Configurare l'identità e le autorizzazioni per l'agente per concedere all'agente l'autorizzazione Secret Manager Secret Accessor (roles/secretmanager.secretAccessor).

Definisci controlli personalizzati delle risorse

Puoi specificare i controlli delle risorse di runtime per l'agente, ad esempio il numero minimo e massimo di istanze dell'applicazione, i limiti delle risorse per ogni container e la concorrenza per ogni container.

min_instances: il numero minimo di istanze dell'applicazione da mantenere in esecuzione in qualsiasi momento, con un intervallo di [0, 10]. Il valore predefinito è 1.

Nota: mentre questa funzionalità è in anteprima, anche se configuri un numero minimo di istanze più elevato, non ti verrà addebitato il tempo in cui un agente è inattivo. Questo comportamento di fatturazione è soggetto a modifiche in futuro.
max_instances: Il numero massimo di istanze dell'applicazione che possono essere avviate per gestire l'aumento del traffico, con un intervallo di [1, 1000]. Il valore predefinito è 100. Se VPC-SC o PSC-I è abilitato, l'intervallo accettabile è [1, 100] per risorsa Vertex AI Agent Engine.
resource_limits: Limiti delle risorse per ogni container. Sono supportate solo le chiavi cpu e memory. Il valore predefinito è {"cpu": "4", "memory": "4Gi"}.
- Gli unici valori supportati per cpu sono 1, 2, 4, 6 e 8. Per saperne di più, consulta Configurare l'allocazione della CPU.
- Gli unici valori supportati per memory sono 1Gi, 2Gi, ... 32Gi.
- Per la CPU richiesta per diversi valori di memoria, consulta Configurare i limiti di memoria.
container_concurrency: Concorrenza per ogni server agente e container. Il valore consigliato è 2 * cpu + 1. Il valore predefinito è 9.

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "min_instances": 1,
        "max_instances": 10,
        "resource_limits": {"cpu": "4", "memory": "8Gi"},
        "container_concurrency": 9,
        # ... other configs
    }
)

Per le best practice su come ottimizzare le risorse di runtime, consulta Ottimizzare e scalare il runtime di Vertex AI Agent Engine.

Definisci le opzioni di build

Puoi specificare le opzioni di build per l'agente, ad esempio gli script di installazione da eseguire durante la creazione dell'immagine container dell'agente. Ciò è utile per installare le dipendenze di sistema (ad esempio, gcloud cli, npx) o altre configurazioni personalizzate. Gli script vengono eseguiti con autorizzazioni root.

Per utilizzare gli script di installazione, crea una directory denominata installation_scripts e inserisci gli script shell al suo interno:

.
├── ...
└── installation_scripts/
    └── install.sh

Successivamente, specifica la directory installation_scripts in extra_packages e i percorsi degli script in build_options:

extra_packages = [..., "installation_scripts/install.sh"]
build_options = {"installation_scripts": ["installation_scripts/install.sh"]}

Puoi utilizzare uno dei seguenti script di installazione comuni:

install_npx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "--- Installing System-Wide Node.js v20.x ---"

# 1. Install prerequisites
apt-get update
apt-get install -y ca-certificates curl gnupg

# 2. Add the NodeSource repository GPG key
mkdir -p /etc/apt/keyrings
curl -fsSL https://deb.nodesource.com/gpgkey/nodesource-repo.gpg.key | gpg --dearmor -o /etc/apt/keyrings/nodesource.gpg

# 3. Add the NodeSource repository for Node.js v20
NODE_MAJOR=20
echo "deb [signed-by=/etc/apt/keyrings/nodesource.gpg] https://deb.nodesource.com/node_$NODE_MAJOR.x nodistro main" | tee /etc/apt/sources.list.d/nodesource.list

# 4. Update package lists again and install Node.js
apt-get update
apt-get install nodejs -y

echo "--- System-wide Node.js installation complete ---"
echo "Verifying versions:"

# These commands will now work for ANY user because node and npx
# are installed in /usr/bin/ which is in everyone's default PATH.
node -v
npm -v
npx -v

install_uvx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "Starting setup..."

# Install uv
apt-get update
apt-get install -y curl
curl -LsSf https://astral.sh/uv/install.sh | env UV_INSTALL_DIR="/usr/local/bin" sh

# These commands will now work for ANY user because uv and uvx
# are installed in /usr/local/bin/ which is in everyone's default PATH.
uv --version
uvx --version

install_gcloud_cli.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

apt-get install -y curl gpg
curl https://packages.cloud.google.com/apt/doc/apt-key.gpg | gpg --dearmor -o /usr/share/keyrings/cloud.google.gpg
echo "deb [signed-by=/usr/share/keyrings/cloud.google.gpg] https://packages.cloud.google.com/apt cloud-sdk main" | tee -a /etc/apt/sources.list.d/google-cloud-sdk.list
apt-get update -y && apt-get install google-cloud-cli -y

gcloud --version

Definisci il framework dell'agente

Puoi specificare il framework dell'agente utilizzato dall'agente:

agent_framework = "google-adk"

Di seguito sono riportati i valori supportati:

Se agent_framework non è specificato, il valore viene rilevato automaticamente se esegui il deployment da un oggetto agente. Se esegui il deployment dai file sorgente, agent_framework è impostato su `custom` per impostazione predefinita.

Definisci una cartella Cloud Storage

Nota:il parametro gcs_dir_name viene utilizzato solo durante il deployment da un oggetto agente.

Gli artefatti di gestione temporanea vengono sovrascritti se corrispondono a una cartella esistente in un bucket Cloud Storage. Se necessario, puoi specificare la cartella Cloud Storage per gli artefatti di staging. Puoi impostare gcs_dir_name su None se non ti preoccupa la potenziale sovrascrittura dei file nella cartella predefinita:

gcs_dir_name = None

Per evitare di sovrascrivere i file (ad esempio per ambienti diversi come sviluppo, gestione temporanea e produzione), puoi configurare la cartella corrispondente e specificare la cartella in cui organizzare temporaneamente l'artefatto:

gcs_dir_name = "dev" # or "staging" or "prod"

Se vuoi o devi evitare collisioni, puoi generare un uuid casuale:

import uuid
gcs_dir_name = str(uuid.uuid4())

Definisci il nome visualizzato

Puoi impostare il nome visualizzato per la risorsa ReasoningEngine:

display_name = "Currency Exchange Rate Agent (Staging)"

Definisci la descrizione

Puoi impostare la descrizione della risorsa ReasoningEngine:

description = """
An agent that has access to tools for looking up the exchange rate.

If you run into any issues, please contact the dev team.
"""

Definisci le etichette

Puoi impostare le etichette della risorsa ReasoningEngine come dizionario di coppie di stringhe chiave-valore. Di seguito è riportato un esempio:

labels = {"author": "username", "version": "latest"}

Configurare un'identità dell'agente predefinita

Puoi eseguire il provisioning degli agenti di cui esegui il deployment in Vertex AI Agent Engine con un'identità unica al momento della creazione dell'agente. L'identità è associata all'ID risorsa dell'agente di Vertex AI Agent Engine ed è indipendente dal framework dell'agente che hai utilizzato per sviluppare l'agente:

identity_type=AGENT_IDENTITY

Per saperne di più, consulta Creare un agente con l'identità dell'agente.

Configura un account di servizio personalizzato

Puoi configurare un account di servizio personalizzato come identità dell'agente di cui è stato eseguito il deployment, anziché l'identità dell'agente o l'identità predefinita.

A questo scopo, specifica l'email del tuo account di servizio personalizzato come service_account quando crei o aggiorni l'istanza di Agent Engine, ad esempio:

# Create a new instance
client.agent_engines.create(
    agent=local_agent,
    config={
        "service_account": "my-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

# Update an existing instance
resource_name = "projects/{project_id}/locations/{location}/reasoningEngines/{reasoning_engine_id}"
client.agent_engines.update(
    name=resource_name,
    agent=local_agent,
    config={
        "service_account": "my-new-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

Nota:specifica solo l'email del account di servizio, non l'URI della risorsa completo, ad esempio projects/{project_id}/serviceAccounts/{service_account_email}.

Configura l'interfaccia Private Service Connect

Se hai configurato l'interfaccia Private Service Connect e il peering DNS, puoi specificare l'allegato di rete e il peering DNS privato durante il deployment dell'agente:

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "psc_interface_config": {
            "network_attachment": "NETWORK_ATTACHMENT",
            "dns_peering_configs": [
                {
                    "domain": "DOMAIN_SUFFIX",
                    "target_project": "TARGET_PROJECT",
                    "target_network": "TARGET_NETWORK",
                },
            ],
        },
    },
)

dove

NETWORK_ATTACHMENT è il nome o il percorso completo del collegamento di rete. Se il collegamento di rete viene creato in un progetto (ad esempio il progetto host VPC condiviso) diverso da quello in cui utilizzi Agent Engine, devi passare il percorso completo del collegamento di rete.
DOMAIN_SUFFIX è il nome DNS della zona Cloud DNS privata che hai creato durante la configurazione del peering DNS privato.
TARGET_PROJECT è il progetto che ospita la rete VPC. Può essere diverso dal progetto di collegamento alla rete.
TARGET_NETWORK è il nome della rete VPC.

Puoi configurare più agenti in modo che utilizzino un singolo collegamento di rete condiviso o collegamenti di rete dedicati univoci. Per utilizzare un collegamento di rete condiviso, fornisci lo stesso collegamento di rete in psc_interface_config per ogni agente che crei.

Configurare le chiavi di crittografia gestite dal cliente

Puoi utilizzare una chiave personalizzata per criptare i dati dell'agente at-rest. Per saperne di più, consulta la sezione Agent Engine Chiavi di crittografia gestite dal cliente (CMEK).

Per configurare la chiave personalizzata (CMEK) per l'agente, devi fornire il nome della risorsa chiave al parametro encryption_spec quando crei l'istanza di Agent Engine.

# The fully qualified key name
kms_key_name = "projects/PROJECT_ID/locations/LOCATION/keyRings/KEY_RING/cryptoKeys/KEY_NAME"

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "encryption_spec": {"kms_key_name": kms_key_name},
        # ... other parameters
    },
)

Configura il link al repository Git di Developer Connect

Per eseguire il deployment da un repository Git utilizzando Developer Connect, segui la documentazione di Developer Connect per creare una connessione e collegarla al repository specifico. Il nome risorsa del link viene utilizzato come git_repository_link durante la distribuzione e segue il formato: projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID.

Crea un'istanza `AgentEngine`

Questa sezione descrive come creare un'istanza AgentEngine per il deployment di un agente.

Per eseguire il deployment di un agente su Vertex AI Agent Engine, puoi scegliere tra i seguenti metodi:

Deployment da un oggetto agente per lo sviluppo interattivo.
Deployment da Developer Connect per i workflow basati su Git.
Deployment dai file di origine per workflow automatizzati basati su file.

Da un oggetto agente

Per eseguire il deployment dell'agente su Vertex AI, utilizza client.agent_engines.create per trasferire l'oggetto local_agent insieme a eventuali configurazioni facoltative:

remote_agent = client.agent_engines.create(
    agent=local_agent,                                  # Optional.
    config={
        "requirements": requirements,                   # Optional.
        "extra_packages": extra_packages,               # Optional.
        "gcs_dir_name": gcs_dir_name,                   # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

Il deployment richiede alcuni minuti, durante i quali vengono eseguiti in background i seguenti passaggi:

A livello locale viene generato un bundle dei seguenti artefatti:
- *.pkl un file pickle corrispondente a local_agent.
- requirements.txt un file di testo contenente i requisiti del pacchetto.
- dependencies.tar.gz un file tar contenente eventuali pacchetti aggiuntivi.
Il bundle viene caricato in Cloud Storage (nella cartella corrispondente) per la gestione temporanea degli artefatti.
Gli URI Cloud Storage per i rispettivi artefatti sono specificati in PackageSpec.
Il servizio Vertex AI Agent Engine riceve la richiesta, crea i container e avvia i server HTTP sul backend.

Da Developer Connect

Per il deployment da Developer Connect su Vertex AI, utilizza client.agent_engines.create fornendo developer_connect_source, entrypoint_module e entrypoint_object nel dizionario di configurazione, insieme ad altre configurazioni facoltative. Questo metodo ti consente di eseguire il deployment del codice direttamente da un repository Git connesso.

remote_agent = client.agent_engines.create(
    config={
        "developer_connect_source": {                   # Required.
            "git_repository_link": "projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID",
            "revision": "main",
            "dir": "path/to/dir",
        },
        "entrypoint_module": "agent",                   # Required.
        "entrypoint_object": "root_agent",              # Required.
        "requirements_file": "requirements.txt",        # Optional.
        # Other optional configs:
        # "env_vars": {...},
        # "service_account": "...",
    },
)

I parametri per il deployment di Developer Connect sono:

developer_connect_source (obbligatorio, dict): la configurazione per il recupero del codice sorgente. Per maggiori dettagli, consulta Configurare il link al repository Git di Developer Connect.
- git_repository_link (obbligatorio, str): il nome della risorsa del link al repository Git di Developer Connect.
- revision (obbligatorio, str): la revisione da recuperare (branch, tag o SHA di commit).
- dir (obbligatorio, str): la directory principale del codice dell'agente all'interno del repository.
entrypoint_module (obbligatorio, str): il nome del modulo Python contenente l'entry point dell'agente, relativo alla directory specificata in developer_connect_source.dir.
entrypoint_object (obbligatorio, str): il nome dell'oggetto chiamabile all'interno di entrypoint_module che rappresenta l'applicazione dell'agente (ad esempio, root_agent).
requirements_file (facoltativo, str): il percorso di un file dei requisiti pip relativo alla radice dell'origine. Il valore predefinito è requirements.txt.

Il deployment richiede alcuni minuti, durante i quali vengono eseguiti in background i seguenti passaggi:

Il servizio Vertex AI Agent Engine recupera il codice sorgente dalla revisione del repository Git specificata.
Il servizio installa le dipendenze da requirements_file (se fornito).
Il servizio avvia l'applicazione agente utilizzando entrypoint_module e entrypoint_object specificati.

Dai file di origine

Per il deployment dai file di origine su Vertex AI, utilizza client.agent_engines.create fornendo source_packages, entrypoint_module, entrypoint_object e class_methods nel dizionario di configurazione, insieme ad altre configurazioni facoltative. Con questo metodo, non è necessario passare un oggetto agente o un bucket Cloud Storage.

remote_agent = client.agent_engines.create(
    config={
        "source_packages": source_packages,             # Required.
        "entrypoint_module": entrypoint_module,         # Required.
        "entrypoint_object": entrypoint_object,         # Required.
        "class_methods": class_methods,                 # Required.
        "requirements_file": requirements_file,         # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

I parametri per il deployment dell'origine in linea sono:

source_packages (obbligatorio, list[str]): un elenco di percorsi di file o directory locali da includere nel deployment. Le dimensioni totali dei file e delle directory in source_packages non devono superare gli 8 MB.
entrypoint_module (obbligatorio, str): il nome completo del modulo Python contenente l'entry point dell'agente (ad esempio, agent_dir.agent).
entrypoint_object (obbligatorio, str): il nome dell'oggetto chiamabile all'interno di entrypoint_module che rappresenta l'applicazione dell'agente (ad esempio, root_agent).

class_methods (obbligatorio, list[dict]): un elenco di dizionari che definiscono i metodi esposti dell'agente. Ogni dizionario include un campo name (obbligatorio), un campo api_mode (obbligatorio) e un campo parameters. Per ulteriori informazioni sui metodi per un agente personalizzato, consulta Elenco delle operazioni supportate.

Ad esempio:

  "class_methods": [
      {
          "name": "method_name",
          "api_mode": "", # Possible options are: "", "async", "async_stream", "stream", "bidi_stream"
          "parameters": {
              "type": "object",
              "properties": {
                  "param1": {"type": "string", "description": "Description of param1"},
                  "param2": {"type": "integer"}
              },
              "required": ["param1"]
          }
      }
  ]
  ```

requirements_file (facoltativo, str): il percorso di un file dei requisiti pip all'interno dei percorsi specificati in source_packages. Il valore predefinito è requirements.txt nella directory radice dell'origine pacchettizzata.

Il deployment richiede alcuni minuti, durante i quali vengono eseguiti in background i seguenti passaggi:

L'SDK Vertex AI crea un archivio tar.gz dei percorsi specificati in source_packages.
Questo archivio viene codificato e inviato direttamente all'API Vertex AI.
Il servizio Vertex AI Agent Engine riceve l'archivio, lo estrae, installa le dipendenze da requirements_file (se fornito) e avvia l'applicazione dell'agente utilizzando entrypoint_module e entrypoint_object specificati.

Di seguito è riportato un esempio di deployment di un agente dai file di origine:

from google.cloud.aiplatform import vertexai

# Example file structure:
# /agent_directory
#     ├── agent.py
#     ├── requirements.txt

# Example agent_directory/agent.py:
# class MyAgent:
#     def ask(self, question: str) -> str:
#         return f"Answer to {question}"
# root_agent = MyAgent()

remote_agent = client.agent_engines.create(
  config={
      "display_name": "My Agent",
      "description": "An agent deployed from a local source.",
      "source_packages": ["agent_directory"],
      "entrypoint_module": "agent_directory.agent",
      "entrypoint_object": "root_agent",
      "requirements_file": "requirements.txt",
      "class_methods": [
          {"name": "ask", "api_mode": "", "parameters": {
              "type": "object",
              "properties": {
                  "question": {"type": "string"}
              },
              "required": ["question"]
          }},
      ],
      # Other optional configs:
      # "env_vars": {...},
      # "service_account": "...",
  }
)

La latenza di deployment dipende dal tempo totale necessario per installare i pacchetti richiesti. Una volta eseguito il deployment, remote_agent corrisponde a un'istanza di local_agent in esecuzione su Vertex AI e può essere interrogata o eliminata.

L'oggetto remote_agent corrisponde a una classe AgentEngine che contiene quanto segue:

remote_agent.api_resource con informazioni sull'agente di cui è stato eseguito il deployment. Puoi anche chiamare remote_agent.operation_schemas() per restituire l'elenco delle operazioni supportate da remote_agent. Per maggiori dettagli, vedi Operazioni supportate.
remote_agent.api_client che consente interazioni di servizio sincrone
remote_agent.async_api_client che consente interazioni asincrone tra servizi

(Facoltativo) Recupera l'ID risorsa agente

Ogni agente di cui è stato eseguito il deployment ha un identificatore univoco. Puoi eseguire il seguente comando per ottenere il nome della risorsa per l'agente di cui è stato eseguito il deployment:

remote_agent.api_resource.name

La risposta dovrebbe essere simile alla seguente stringa:

"projects/PROJECT_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"

dove

PROJECT_ID è l' Google Cloud ID progetto in cui viene eseguito l'agente di cui è stato eseguito il deployment.
LOCATION è la regione in cui viene eseguito l'agente di cui è stato eseguito il deployment.
RESOURCE_ID è l'ID dell'agente di cui è stato eseguito il deployment come risorsa reasoningEngine.

(Facoltativo) Elenca le operazioni supportate

Ogni agente di cui è stato eseguito il deployment ha un elenco di operazioni supportate. Puoi utilizzare AgentEngine.operation_schemas per ottenere l'elenco delle operazioni supportate dall'agente di cui è stato eseguito il deployment:

remote_agent.operation_schemas()

Lo schema di ogni operazione è un dizionario che documenta le informazioni di un metodo per l'agente che puoi chiamare. Il set di operazioni supportate dipende dal framework che hai utilizzato per sviluppare l'agente:

(Facoltativo) Concedi le autorizzazioni dell'agente di cui è stato eseguito il deployment

Se è necessario concedere ulteriori autorizzazioni all'agente di cui è stato eseguito il deployment, segui le istruzioni riportate in Configurare l'identità e le autorizzazioni per l'agente.

Esegui il deployment di un agente Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Prerequisiti

(Facoltativo) Configura l'agente per il deployment

Definisci i requisiti del pacchetto

ADK

A2A

LangChain

LangGraph

AG2

LlamaIndex

Definisci pacchetti aggiuntivi

Definisci le variabili di ambiente

Dizionario

Elenco

Definisci controlli personalizzati delle risorse

Definisci le opzioni di build

install_npx.sh

install_uvx.sh

install_gcloud_cli.sh

Definisci il framework dell'agente

Definisci una cartella Cloud Storage

Definisci il nome visualizzato

Definisci la descrizione

Definisci le etichette

Configurare un'identità dell'agente predefinita

Configura un account di servizio personalizzato

Configura l'interfaccia Private Service Connect

Configurare le chiavi di crittografia gestite dal cliente

Configura il link al repository Git di Developer Connect

Crea un'istanza AgentEngine

Da un oggetto agente

Da Developer Connect

Dai file di origine

(Facoltativo) Recupera l'ID risorsa agente

(Facoltativo) Elenca le operazioni supportate

(Facoltativo) Concedi le autorizzazioni dell'agente di cui è stato eseguito il deployment

Passaggi successivi

Esegui il deployment di un agente

Crea un'istanza `AgentEngine`