Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Agent bereitstellen

Wenn Sie einen Agenten in der Agent Runtime bereitstellen, ist er remote verfügbar, um Anfragen zu bearbeiten. In diesem Dokument wird beschrieben, wie Sie einen Agent basierend auf Ihrem Entwicklungs-Workflow bereitstellen können: über ein Ausführungsobjekt, lokale Quelldateien, ein Dockerfile, ein in Artifact Registry gehostetes Container-Image oder direkt über ein verbundenes Git-Repository.

Sie haben folgende Möglichkeiten, einen Agent in Agent Runtime bereitzustellen:

Über ein Agent-Objekt bereitstellen: Ideal für die interaktive Entwicklung in Umgebungen wie Colab, da die Bereitstellung von local_agent-Objekten im Arbeitsspeicher möglich ist. Diese Methode eignet sich am besten für Agents mit Strukturen, die keine komplexen, nicht serialisierbaren Komponenten enthalten.
Aus Quelldateien bereitstellen: Diese Methode eignet sich gut für automatisierte Workflows wie CI/CD-Pipelines und Infrastruktur-als-Code-Tools wie Terraform, die vollständig deklarative und automatisierte Bereitstellungen ermöglichen. Der Agent wird direkt aus dem lokalen Quellcode bereitgestellt und es ist kein Cloud Storage-Bucket erforderlich.
Über Dockerfile bereitstellen: Diese Methode ähnelt der Methode für die Bereitstellung über Quelldateien. Sie stellen Ihren Agent direkt aus lokalem Quellcode bereit. Sie benötigen keinen Cloud Storage-Bucket. Diese Methode ist geeignet, wenn Sie den bereitgestellten API-Server definieren und steuern müssen.
Über Container-Image bereitstellen: Diese Methode ähnelt der Methode zum Bereitstellen über Dockerfile. Sie stellen ein Container-Image bereit, das in Artifact Registry gehostet wird. Verwenden Sie diese Methode, wenn Sie die Kontrolle über den Buildprozess für das Container-Image und eine geringere Bereitstellungslatenz benötigen.
Über Developer Connect bereitstellen: Empfohlen für Projekte, die in einem Git-Repository verwaltet werden, das über Developer Connect verknüpft ist. Diese Methode vereinfacht die Bereitstellung von Agents direkt aus Ihrem Quellcode und unterstützt nativ die Versionsverwaltung, die Zusammenarbeit im Team und CI/CD-Pipelines. Bevor Sie diese Methode verwenden, richten Sie Ihren Git-Repository-Link ein. Folgen Sie dazu der Anleitung unter Git-Repository-Link von Developer Connect einrichten.

So legen Sie los:

Voraussetzungen erfüllen
Optional: KI-Agent für die Bereitstellung konfigurieren
Agent Platform-Instanz erstellen
Optional: Agenten-Ressourcen-ID abrufen
Optional: Unterstützte Vorgänge auflisten
Optional: Berechtigungen für den bereitgestellten Agenten gewähren

Sie können auch die Agents CLI für die Bereitstellung verwenden.

Vorbereitung

Bevor Sie einen Agenten bereitstellen, müssen Sie die folgenden Aufgaben ausführen:

Optional: Agent für die Bereitstellung konfigurieren

Sie können die folgenden optionalen Konfigurationen für Ihren Agent vornehmen:

Paketanforderungen definieren

Hinweis:Bei Bereitstellungen aus Quelldateien müssen Sie den Parameter requirements nicht verwenden. Fügen Sie stattdessen eine requirements.txt-Datei direkt in Ihr Quellcodepaket ein. Der Pfad zu dieser Datei kann beim Erstellen der Agent Platform-Instanz im Parameter requirements_file angegeben werden.

Geben Sie die Gruppe von Paketen an, die für die Bereitstellung des Agents erforderlich sind. Die Gruppe von Paketen kann entweder eine Liste von Elementen sein, die von pip installiert werden sollen, oder der Pfad zu einer Datei, die dem Format der Anforderungsdatei entspricht. Beachten Sie die folgenden Best Practices:

Pinnen Sie Ihre Paketversionen für reproduzierbare Builds. Zu den gängigen Paketen, die Sie im Blick behalten sollten, gehören: google-cloud-aiplatform, cloudpickle, langchain, langchain-core, langchain-google-vertexai und pydantic.
Minimieren Sie die Anzahl der Abhängigkeiten in Ihrem Agent. Dadurch wird die Anzahl der funktionsgefährdenden Änderungen beim Aktualisieren Ihrer Abhängigkeiten und Ihres Agents reduziert.

Wenn der Agent keine Abhängigkeiten hat, können Sie requirements auf None setzen:

requirements = None

Wenn der KI-Agent eine frameworkspezifische Vorlage verwendet, sollten Sie bei der Entwicklung des KI-Agents die importierte SDK-Version angeben (z. B. 1.112.0).

ADK

requirements = [
    "google-cloud-aiplatform[agent_engines,adk]",
    # any other dependencies
]

A2A

requirements = [
    "google-cloud-aiplatform[agent_engines]",
    "google-adk[a2a]",
    # any other dependencies
]

LangChain

requirements = [
    "google-cloud-aiplatform[agent_engines,langchain]",
    # any other dependencies
]

LangGraph

requirements = [
    "google-cloud-aiplatform[agent_engines,langgraph]",
    # any other dependencies
]

AG2

requirements = [
    "google-cloud-aiplatform[agent_engines,ag2]",
    # any other dependencies
]

LlamaIndex

Die folgende Anleitung bezieht sich auf die LlamaIndex-Abfragepipeline:

requirements = [
    "google-cloud-aiplatform[agent_engines,llama_index]",
    # any other dependencies
]

Mit dem Paket requirements haben Sie außerdem folgende Möglichkeiten:

Obergrenze für die Version eines bestimmten Pakets festlegen oder die Version eines bestimmten Pakets fixieren (z. B. google-cloud-aiplatform):

  requirements = [
      # See https://pypi.org/project/google-cloud-aiplatform for the latest version.
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
  ]

Zusätzliche Pakete und Einschränkungen hinzufügen:

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]==1.112.0",
      "cloudpickle==3.0", # new
  ]

Auf die Version eines Pakets in einem GitHub-Branch oder einer Pull-Anfrage verweisen:

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk] @ git+https://github.com/googleapis/python-aiplatform.git@BRANCH_NAME", # new
  ]

Führen Sie die Liste der Anforderungen in einer Datei (z. B. path/to/requirements.txt):
```
  requirements = "path/to/requirements.txt"
  
```
Dabei ist path/to/requirements.txt eine Textdatei, die dem Format der Anforderungsdatei entspricht. Beispiel:
```
  google-cloud-aiplatform[agent_engines,adk]
  cloudpickle==3.0
  
```

Zusätzliche Pakete definieren

Hinweis:Der Parameter extra_packages wird nur verwendet, wenn die Bereitstellung über ein Agent-Objekt erfolgt.

Sie können lokale Dateien oder Verzeichnisse einfügen, die erforderliche lokale Python-Quelldateien enthalten. Im Vergleich zu Paketanforderungen können Sie so private Dienstprogramme verwenden, die Sie entwickelt haben und die sonst nicht auf PyPI oder GitHub verfügbar sind.

Wenn für den Agent keine zusätzlichen Pakete erforderlich sind, können Sie extra_packages auf None festlegen:

extra_packages = None

Mit extra_packages haben Sie auch folgende Möglichkeiten:

Eine einzelne Datei einfügen (z. B. agents/agent.py):
```
  extra_packages = ["agents/agent.py"]
  
```

Fügen Sie die Dateien eines gesamten Verzeichnisses ein (z. B. agents/):

  extra_packages = ["agents"] # directory that includes agents/agent.py

Geben Sie Python-Rad-Binärdateien an (z. B. path/to/python_package.whl):

  requirements = [
      "google-cloud-aiplatform[agent_engines,adk]",
      "cloudpickle==3.0",
      "python_package.whl",  # install from the whl file that was uploaded
  ]
  extra_packages = ["path/to/python_package.whl"]  # bundle the whl file for uploading

Umgebungsvariablen definieren

Wenn Ihr Agent von Umgebungsvariablen abhängt, können Sie diese im Argument env_vars= angeben. Wenn der Agent nicht von Umgebungsvariablen abhängt, können Sie ihn auf None setzen:

env_vars = None

Wenn Sie Secrets als Umgebungsvariablen mit einem Agent verwenden, der für die Verwendung der Agent-Identität konfiguriert ist, gewähren Sie dem Agent Platform-Dienst-Agent, der das folgende Format hat, die Berechtigung secretmanager.versions.access (in der Rolle roles/secretmanager.secretAccessor enthalten):

service-PROJECT_NUMBER@gcp-sa-aiplatform.iam.gserviceaccount.com

Ihre konfigurierte KI-Agentenidentität wird zur Laufzeit verwendet, aber der Agent Platform Service Agent wird verwendet, um während der Bereitstellung Secrets abzurufen. Mit der hinzugefügten Berechtigung kann der Dienst-Agent die Secret-Werte während der Bereitstellung aus Secret Manager abrufen.

Warnung:Die folgenden Umgebungsvariablen sollten nicht festgelegt werden: GOOGLE_CLOUD_PROJECT, GOOGLE_CLOUD_QUOTA_PROJECT, GOOGLE_CLOUD_LOCATION, PORT, K_SERVICE, K_REVISION, K_CONFIGURATION und GOOGLE_APPLICATION_CREDENTIALS. Außerdem sollten Sie das Präfix GOOGLE_CLOUD_AGENT_ENGINE vermeiden, um Namenskonflikte mit Umgebungsvariablen der Agent Runtime zu vermeiden.

Es gibt verschiedene Möglichkeiten, die Umgebungsvariablen anzugeben:

Wörterbuch

env_vars = {
  "VARIABLE_1": "VALUE_1",
  "VARIABLE_2": "VALUE_2",
}
# These environment variables will become available in Agent Platform
# through `os.environ`, e.g.
#
#   import os
#   os.environ["VARIABLE_1"] # will have the value "VALUE_1"
#
# and
#
#   os.environ["VARIABLE_2"] # will have the value "VALUE_2"
#

Wenn Sie auf ein Secret in Secret Manager verweisen und es als Umgebungsvariable (z. B. CLOUD_SQL_CREDENTIALS_SECRET) verfügbar sein soll, folgen Sie zuerst der Anleitung zum Erstellen eines Secrets für CLOUD_SQL_CREDENTIALS_SECRET in Ihrem Projekt, bevor Sie die Umgebungsvariablen so angeben:

env_vars = {
  # ... (other environment variables and their values)
  "CLOUD_SQL_CREDENTIALS_SECRET": {"secret": SECRET_ID, "version": SECRET_VERSION_ID},
}

Dabei gilt:

SECRET_VERSION_ID ist die ID der Secret-Version.
SECRET_ID ist die ID des Secrets.

Im Agent-Code können Sie dann so auf das Secret verweisen:

secret = os.environ.get("CLOUD_SQL_CREDENTIALS_SECRET")
if secret:
  # Secrets are stored as strings, so use json.loads to parse JSON
  # payloads.
  return json.loads(secret)

Liste

env_vars = ["VARIABLE_1", "VARIABLE_2"]
# This corresponds to the following code snippet:
#
#   import os
#
#   env_vars = {
#     "VARIABLE_1": os.environ["VARIABLE_1"],
#     "VARIABLE_2": os.environ["VARIABLE_2"],
#   }

Außerdem müssen Sie die Anleitung unter Identität und Berechtigungen für Ihren Agent einrichten befolgen, um Ihrem Agent die Berechtigung „Secret Manager Secret Accessor“ (roles/secretmanager.secretAccessor) zu erteilen.

Benutzerdefinierte Ressourcenkontrollen definieren

Sie können Laufzeitressourcen für den Agenten festlegen, z. B. die Mindest- und Höchstzahl von Anwendungsinstanzen, Ressourcenlimits für jeden Container und die Nebenläufigkeit für jeden Container.

min_instances: Die Mindestanzahl der Anwendungsinstanzen, die jederzeit ausgeführt werden sollen, mit einem Bereich von [0, 10]. Der Standardwert ist 1.

Hinweis:Während sich diese Funktion in der Vorabversion befindet, wird Ihnen auch dann keine Inaktivitätszeit eines Agents in Rechnung gestellt, wenn Sie eine höhere Mindestanzahl von Instanzen konfigurieren. Dieses Abrechnungsverhalten kann sich in Zukunft ändern.
max_instances: Die maximale Anzahl von Anwendungsinstanzen, die gestartet werden können, um mehr Traffic zu bewältigen. Der Bereich liegt zwischen [1, 1000]. Der Standardwert ist 100. Wenn VPC-SC oder PSC-I aktiviert ist, liegt der zulässige Bereich bei [1, 100] pro Agent Platform-Ressource.
resource_limits: Ressourcenlimits für jeden Container. Es werden nur cpu- und memory-Schlüssel unterstützt. Der Standardwert ist {"cpu": "4", "memory": "4Gi"}.
- Die einzigen unterstützten Werte für cpu sind 1, 2, 4, 6 und 8. Weitere Informationen finden Sie unter CPU-Zuweisung konfigurieren.
- Die einzigen unterstützten Werte für memory sind 1Gi, 2Gi, … 32Gi.
- Informationen zur erforderlichen CPU für verschiedene Speicherwerte finden Sie unter Arbeitsspeicherlimits konfigurieren.
container_concurrency: Nebenläufigkeit für jeden Container und KI-Agentenserver. Der empfohlene Wert ist 2 × cpu + 1. Der Standardwert ist 9.

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "min_instances": 1,
        "max_instances": 10,
        "resource_limits": {"cpu": "4", "memory": "8Gi"},
        "container_concurrency": 9,
        # ... other configs
    }
)

Best Practices zur Optimierung von Laufzeitressourcen finden Sie unter Agent-Laufzeit optimieren und skalieren.

Build-Optionen definieren

Sie können Build-Optionen für den Agent angeben, z. B. Installationsskripts, die beim Erstellen des Container-Images des Agents ausgeführt werden sollen. Das ist nützlich, um Systemabhängigkeiten (z. B. gcloud cli, npx) oder andere benutzerdefinierte Setups zu installieren. Die Skripts werden mit Root-Berechtigungen ausgeführt.

Wenn Sie Installationsskripts verwenden möchten, erstellen Sie ein Verzeichnis mit dem Namen installation_scripts und legen Sie Ihre Shell-Skripts in diesem Verzeichnis ab:

.
├── ...
└── installation_scripts/
    └── install.sh

Geben Sie als Nächstes das Verzeichnis installation_scripts in extra_packages und die Skriptpfade in build_options an:

extra_packages = [..., "installation_scripts/install.sh"]
build_options = {"installation_scripts": ["installation_scripts/install.sh"]}

Sie können eines der folgenden gängigen Installationsskripts verwenden:

install_npx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "--- Installing System-Wide Node.js v20.x ---"

# 1. Install prerequisites
apt-get update
apt-get install -y ca-certificates curl gnupg

# 2. Add the NodeSource repository GPG key
mkdir -p /etc/apt/keyrings
curl -fsSL https://deb.nodesource.com/gpgkey/nodesource-repo.gpg.key | gpg --dearmor -o /etc/apt/keyrings/nodesource.gpg

# 3. Add the NodeSource repository for Node.js v20
NODE_MAJOR=20
echo "deb [signed-by=/etc/apt/keyrings/nodesource.gpg] https://deb.nodesource.com/node_$NODE_MAJOR.x nodistro main" | tee /etc/apt/sources.list.d/nodesource.list

# 4. Update package lists again and install Node.js
apt-get update
apt-get install nodejs -y

echo "--- System-wide Node.js installation complete ---"
echo "Verifying versions:"

# These commands will now work for ANY user because node and npx
# are installed in /usr/bin/ which is in everyone's default PATH.
node -v
npm -v
npx -v

install_uvx.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

echo "Starting setup..."

# Install uv
apt-get update
apt-get install -y curl
curl -LsSf https://astral.sh/uv/install.sh | env UV_INSTALL_DIR="/usr/local/bin" sh

# These commands will now work for ANY user because uv and uvx
# are installed in /usr/local/bin/ which is in everyone's default PATH.
uv --version
uvx --version

install_gcloud_cli.sh

#!/bin/bash

# Exit immediately if a command exits with a non-zero status.
set -e

apt-get install -y curl gpg
curl https://packages.cloud.google.com/apt/doc/apt-key.gpg | gpg --dearmor -o /usr/share/keyrings/cloud.google.gpg
echo "deb [signed-by=/usr/share/keyrings/cloud.google.gpg] https://packages.cloud.google.com/apt cloud-sdk main" | tee -a /etc/apt/sources.list.d/google-cloud-sdk.list
apt-get update -y && apt-get install google-cloud-cli -y

gcloud --version

Agent-Framework definieren

Sie können das Agent-Framework angeben, das Ihr Agent verwendet:

agent_framework = "google-adk"

Folgende Werte werden unterstützt:

Wenn agent_framework nicht angegeben ist, wird der Wert automatisch erkannt, wenn Sie über ein Agent-Objekt bereitstellen. Wenn Sie aus Quelldateien bereitstellen, wird für agent_framework standardmäßig „custom“ verwendet.

Cloud Storage-Ordner definieren

Hinweis:Der Parameter gcs_dir_name wird nur bei der Bereitstellung über ein Agent-Objekt verwendet.

Staging-Artefakte werden überschrieben, wenn sie einem vorhandenen Ordner in einem Cloud Storage-Bucket entsprechen. Bei Bedarf können Sie den Cloud Storage-Ordner für die Staging-Artefakte angeben. Sie können gcs_dir_name auf None festlegen, wenn Sie nichts dagegen haben, dass die Dateien im Standardordner möglicherweise überschrieben werden:

gcs_dir_name = None

Damit die Dateien nicht überschrieben werden (z. B. für verschiedene Umgebungen wie Entwicklung, Staging und Produktion), können Sie einen entsprechenden Ordner einrichten und den Ordner angeben, in dem das Artefakt bereitgestellt werden soll:

gcs_dir_name = "dev" # or "staging" or "prod"

Wenn Sie Kollisionen vermeiden möchten oder müssen, können Sie eine zufällige uuid generieren:

import uuid
gcs_dir_name = str(uuid.uuid4())

Anzeigenamen definieren

Sie können den Anzeigenamen für die Ressource ReasoningEngine festlegen:

display_name = "Currency Exchange Rate Agent (Staging)"

Beschreibung definieren

Sie können die Beschreibung der ReasoningEngine-Ressource festlegen:

description = """
An agent that has access to tools for looking up the exchange rate.

If you run into any issues, please contact the dev team.
"""

Labels definieren

Sie können die Labels der ReasoningEngine-Ressource als Dictionary von Schlüssel/Wert-Stringpaaren festlegen. Hier ein Beispiel:

labels = {"author": "username", "version": "latest"}

Standardidentität für KI‑Agenten konfigurieren

Sie können Agenten, die Sie auf der Agent Platform bereitstellen, beim Erstellen des Agents mit einer eindeutigen Identität versehen. Die Identität ist an die Agent-Ressourcen-ID der Agent-Plattform gebunden und unabhängig vom Agent-Framework, das Sie zum Entwickeln des Agenten verwendet haben:

identity_type=AGENT_IDENTITY

Weitere Informationen finden Sie unter Agent mit Agent-Identität erstellen.

Benutzerdefiniertes Dienstkonto konfigurieren

Sie können ein benutzerdefiniertes Dienstkonto als Identität Ihres bereitgestellten Agents konfigurieren, anstatt die Agent-Identität oder Standardidentität zu verwenden.

Geben Sie dazu beim Erstellen oder Aktualisieren der Agent Platform-Instanz die E-Mail-Adresse Ihres benutzerdefinierten Dienstkontos als service_account an, z. B.:

# Create a new instance
client.agent_engines.create(
    agent=local_agent,
    config={
        "service_account": "my-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

# Update an existing instance
resource_name = "projects/{project_id}/locations/{location}/reasoningEngines/{reasoning_engine_id}"
client.agent_engines.update(
    name=resource_name,
    agent=local_agent,
    config={
        "service_account": "my-new-custom-service-account@my-project.iam.gserviceaccount.com",
        # ...
    },
)

Hinweis:Geben Sie nur die E-Mail-Adresse des Dienstkontos an, nicht den vollständigen Ressourcen-URI, z. B. projects/{project_id}/serviceAccounts/{service_account_email}.

Private Service Connect-Schnittstelle konfigurieren

Wenn Sie Private Service Connect-Schnittstelle und private DNS-Zone eingerichtet haben, können Sie beim Bereitstellen Ihres Agents die Netzwerkverbindung angeben und privates DNS-Peering erstellen:

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "psc_interface_config": {
            "network_attachment": "NETWORK_ATTACHMENT",
            "dns_peering_configs": [
                {
                    "domain": "DOMAIN_SUFFIX",
                    "target_project": "TARGET_PROJECT",
                    "target_network": "TARGET_NETWORK",
                },
            ],
        },
    },
)

Dabei gilt:

NETWORK_ATTACHMENT ist der Name oder der vollständige Pfad Ihres Netzwerk-Anhangs. Wenn der Netzwerkanhang in einem anderen Projekt als dem, in dem Sie die Agent-Plattform verwenden, erstellt wird (z. B. im freigegebene VPC-Hostprojekt), müssen Sie den vollständigen Pfad des Netzwerkanhangs übergeben.
DOMAIN_SUFFIX ist der DNS-Name der privaten Cloud DNS-Zone.
TARGET_PROJECT ist das Projekt, in dem das VPC-Netzwerk gehostet wird. Es kann sich vom Projekt für die Netzwerkverbindung unterscheiden.
TARGET_NETWORK ist der Name des VPC-Netzwerk im `TARGET_PROJECT`, für das das DNS-Peering eingerichtet wird.

Sie können mehrere Agents so konfigurieren, dass sie entweder einen einzelnen, freigegebenen Netzwerkanhang oder eindeutige, dedizierte Netzwerkanhänge verwenden. Wenn Sie einen freigegebenen Netzwerkanhang verwenden möchten, geben Sie für jeden erstellten Agent denselben Netzwerkanhang in psc_interface_config an.

Kundenverwaltete Verschlüsselungsschlüssel konfigurieren

Sie können einen benutzerdefinierten Schlüssel verwenden, um die ruhenden Daten Ihres Agenten zu verschlüsseln. Weitere Informationen finden Sie unter Agent Engine Vom Kunden verwaltete Verschlüsselungsschlüssel (CMEK).

Wenn Sie den benutzerdefinierten Schlüssel (CMEK) für Ihren Agenten konfigurieren möchten, müssen Sie beim Erstellen der Agent Platform-Instanz den Ressourcennamen des Schlüssels für den Parameter encryption_spec angeben.

# The fully qualified key name
kms_key_name = "projects/PROJECT_ID/locations/LOCATION/keyRings/KEY_RING/cryptoKeys/KEY_NAME"

remote_agent = client.agent_engines.create(
    agent=local_agent,
    config={
        "encryption_spec": {"kms_key_name": kms_key_name},
        # ... other parameters
    },
)

Git-Repository-Link von Developer Connect einrichten

Wenn Sie die Bereitstellung über ein Git-Repository mit Developer Connect vornehmen möchten, folgen Sie der Developer Connect-Dokumentation, um eine Verbindung zu erstellen und mit dem entsprechenden Repository zu verknüpfen. Der Ressourcenname des Links wird während des Deployments als git_repository_link verwendet und hat das folgende Format: projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID.

Agent Platform-Instanz erstellen

In diesem Abschnitt wird beschrieben, wie Sie eine Agent Platform-Instanz zum Bereitstellen eines Agents erstellen.

Wenn Sie einen Agent auf der Agent Platform bereitstellen möchten, können Sie zwischen den folgenden Methoden wählen:

Bereitstellung über ein Agent-Objekt für die interaktive Entwicklung
Bereitstellung über Developer Connect für Git-basierte Workflows.
Bereitstellung aus Quelldateien oder Dockerfile für dateibasierte Workflows.
Bereitstellung über Container-Image für bildbasierte Workflows.

Python-Objekt

Wenn Sie den Agent auf der Agent Platform bereitstellen möchten, verwenden Sie client.agent_engines.create, um das local_agent-Objekt zusammen mit optionalen Konfigurationen zu übergeben:

remote_agent = client.agent_engines.create(
    agent=local_agent,                                  # Optional.
    config={
        "requirements": requirements,                   # Optional.
        "extra_packages": extra_packages,               # Optional.
        "gcs_dir_name": gcs_dir_name,                   # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

Die Bereitstellung dauert einige Minuten. Im Hintergrund werden dabei die folgenden Schritte ausgeführt:

Lokal wird ein Bündel der folgenden Artefakte generiert:
- *.pkl: Eine Pickle-Datei, die local_agent entspricht.
- requirements.txt – eine Textdatei mit den Paketanforderungen.
- dependencies.tar.gz: Eine TAR-Datei mit allen zusätzlichen Paketen.
Das Bündel wird in Cloud Storage hochgeladen (in den entsprechenden Ordner), um die Artefakte bereitzustellen.
Die Cloud Storage-URIs für die jeweiligen Artefakte werden in der PackageSpec angegeben.
Der Agent Runtime-Dienst empfängt die Anfrage, erstellt Container und startet HTTP-Server im Backend.

Developer Connect

Wenn Sie über Developer Connect auf der Agent Platform bereitstellen möchten, verwenden Sie client.agent_engines.create. Geben Sie dazu developer_connect_source, entrypoint_module und entrypoint_object im Konfigurations-Dictionary an, zusammen mit anderen optionalen Konfigurationen. Mit dieser Methode können Sie Code direkt aus einem verbundenen Git-Repository bereitstellen.

remote_agent = client.agent_engines.create(
    config={
        "developer_connect_source": {                   # Required.
            "git_repository_link": "projects/PROJECT_ID/locations/LOCATION/connections/CONNECTION_ID/gitRepositoryLinks/REPO_ID",
            "revision": "main",
            "dir": "path/to/dir",
        },
        "entrypoint_module": "agent",                   # Required.
        "entrypoint_object": "root_agent",              # Required.
        "requirements_file": "requirements.txt",        # Optional.
        # Other optional configs:
        # "env_vars": {...},
        # "service_account": "...",
    },
)

Die Parameter für die Developer Connect-Bereitstellung sind:

developer_connect_source (erforderlich, dict): Die Konfiguration zum Abrufen von Quellcode. Weitere Informationen finden Sie unter Git-Repository-Link von Developer Connect einrichten.
- git_repository_link (Erforderlich, str): Der Ressourcenname des Developer Connect-Git-Repository-Links.
- revision (erforderlich, str): Die abzurufende Revision (Branch, Tag oder Commit-SHA).
- dir (erforderlich, str): Das Stammverzeichnis des Agent-Codes im Repository.
entrypoint_module (erforderlich, str): Der Name des Python-Moduls, das den Einstiegspunkt des Agents enthält, relativ zum Verzeichnis, das in developer_connect_source.dir angegeben ist.
entrypoint_object (erforderlich, str): Der Name des aufrufbaren Objekts in der entrypoint_module, das die Agent-Anwendung darstellt (z. B. root_agent).
requirements_file (Optional, str): Der Pfad zu einer pip-Anforderungsdatei relativ zum Quell-Root. Die Standardeinstellung ist requirements.txt.

Die Bereitstellung dauert einige Minuten. Im Hintergrund werden dabei die folgenden Schritte ausgeführt:

Der Agent Runtime-Dienst ruft den Quellcode aus der angegebenen Git-Repository-Revision ab.
Der Dienst installiert Abhängigkeiten aus requirements_file (falls angegeben).
Der Dienst startet die Agent-Anwendung mit den angegebenen entrypoint_module und entrypoint_object.

Quelldateien

Wenn Sie die Bereitstellung über Quellcode auf der Agent Platform vornehmen möchten, verwenden Sie client.agent_engines.create. Geben Sie dazu source_packages, entrypoint_module, entrypoint_object und class_methods im Konfigurations-Dictionary an, zusammen mit anderen optionalen Konfigurationen. Bei dieser Methode müssen Sie kein Agent-Objekt oder Cloud Storage-Bucket übergeben.

remote_agent = client.agent_engines.create(
    config={
        "source_packages": source_packages,             # Required.
        "entrypoint_module": entrypoint_module,         # Required.
        "entrypoint_object": entrypoint_object,         # Required.
        "class_methods": class_methods,                 # Required.
        "requirements_file": requirements_file,         # Optional.
        "display_name": display_name,                   # Optional.
        "description": description,                     # Optional.
        "labels": labels,                               # Optional.
        "env_vars": env_vars,                           # Optional.
        "build_options": build_options,                 # Optional.
        "identity_type": identity_type,                 # Optional.
        "service_account": service_account,             # Optional.
        "min_instances": min_instances,                 # Optional.
        "max_instances": max_instances,                 # Optional.
        "resource_limits": resource_limits,             # Optional.
        "container_concurrency": container_concurrency, # Optional
        "encryption_spec": encryption_spec,             # Optional.
        "agent_framework": agent_framework,             # Optional.
    },
)

Die Parameter für die Bereitstellung von Inline-Quellen sind:

source_packages (erforderlich, list[str]): Eine Liste mit lokalen Datei- oder Verzeichnispfaden, die in die Bereitstellung aufgenommen werden sollen. Die Gesamtgröße der Dateien und Verzeichnisse in source_packages darf 8 MB nicht überschreiten.
entrypoint_module (erforderlich, str): Der voll qualifizierte Python-Modulname, der den Agent-Einstiegspunkt enthält (z. B. agent_dir.agent).
entrypoint_object (erforderlich, str): Der Name des aufrufbaren Objekts in der entrypoint_module, das die Agent-Anwendung darstellt (z. B. root_agent).

class_methods (erforderlich, list[dict]): Eine Liste von Dictionaries, die die verfügbaren Methoden des Agents definieren. Jedes Wörterbuch enthält die Felder name (erforderlich), api_mode (erforderlich) und parameters. Weitere Informationen zu den Methoden für einen benutzerdefinierten Agent finden Sie unter Unterstützte Vorgänge auflisten.

Beispiel:

  "class_methods": [
      {
          "name": "method_name",
          "api_mode": "", # Possible options are: "", "async", "async_stream", "stream", "bidi_stream"
          "parameters": {
              "type": "object",
              "properties": {
                  "param1": {"type": "string", "description": "Description of param1"},
                  "param2": {"type": "integer"}
              },
              "required": ["param1"]
          }
      }
  ]
  ```

requirements_file (Optional, str): Der Pfad zu einer pip-Anforderungsdatei in den in source_packages angegebenen Pfaden. Standardmäßig ist requirements.txt im Stammverzeichnis der verpackten Quelle festgelegt.

Die Bereitstellung dauert einige Minuten. Im Hintergrund werden dabei die folgenden Schritte ausgeführt:

Mit dem Agent Platform SDK wird ein tar.gz-Archiv der in source_packages angegebenen Pfade erstellt.
Dieses Archiv wird codiert und direkt an die Agent Platform API gesendet.
Der Agent Runtime-Dienst empfängt das Archiv, extrahiert es, installiert Abhängigkeiten aus requirements_file (falls angegeben) und startet die Agent-Anwendung mit den angegebenen entrypoint_module und entrypoint_object.

Im Folgenden finden Sie ein Beispiel für die Bereitstellung eines Agents aus Quellcode:

from google.cloud.aiplatform import vertexai

# Example file structure:
# /agent_directory
#     ├── agent.py
#     ├── requirements.txt

# Example agent_directory/agent.py:
# class MyAgent:
#     def ask(self, question: str) -> str:
#         return f"Answer to {question}"
# root_agent = MyAgent()

remote_agent = client.agent_engines.create(
  config={
      "display_name": "My Agent",
      "description": "An agent deployed from a local source.",
      "source_packages": ["agent_directory"],
      "entrypoint_module": "agent_directory.agent",
      "entrypoint_object": "root_agent",
      "requirements_file": "requirements.txt",
      "class_methods": [
          {"name": "ask", "api_mode": "", "parameters": {
              "type": "object",
              "properties": {
                  "question": {"type": "string"}
              },
              "required": ["question"]
          }},
      ],
      # Other optional configs:
      # "env_vars": {...},
      # "service_account": "...",
  }
)

Dockerfile

Die Bereitstellung über ein Dockerfile auf der Agent-Plattform ähnelt der Bereitstellung über Quelldateien. Die einzige Stelle, die sich beim Bereitstellen ändert, ist, dass entrypoint_module, entrypoint_object und (optional) requirements_file in der Konfiguration durch ein image_spec ersetzt werden.

Im Folgenden sehen Sie ein Beispiel für die Bereitstellung eines Agenten mit einem Dockerfile:

from google.cloud.aiplatform import vertexai

# Example file structure:
# /current_directory
#     ├── agent.py
#     ├── main.py
#     ├── requirements.txt
#     ├── Dockerfile

remote_agent = client.agent_engines.create(
    config={
        "source_packages": [
            "agent.py",
            "main.py",
            "requirements.txt",
            "Dockerfile",
        ],
        "image_spec": {},  # tells Agent Runtime to use the Dockerfile
        # Other optional configs
    }
)

Container-Image

Wenn Sie die Bereitstellung über ein Container-Image vornehmen möchten, folgen Sie zuerst der Einrichtungsanleitung unter Eigenen Container verwenden. Achten Sie darauf, dass Sie eine Version von google-cloud-aiplatform installieren, die >=1.144 erfüllt. Führen Sie als Nächstes den folgenden Code aus:

remote_agent = client.agent_engines.create(
    config={
        "container_spec": {
            "image_uri": "CONTAINER_IMAGE_URI",
        },
        # Other optional configs
    },
)

Dabei entspricht CONTAINER_IMAGE_URI dem URI des Container-Images in Artifact Registry (z. B. us-central1-docker.pkg.dev/my-project/my-repo/my-image:tag).

Die Bereitstellungslatenz hängt von der Gesamtzeit ab, die für die Installation der erforderlichen Pakete benötigt wird. Nach der Bereitstellung entspricht remote_agent einer Instanz von local_agent, die auf der Agent Platform ausgeführt wird und abgefragt oder gelöscht werden kann.

Das remote_agent-Objekt entspricht einer AgentEngine-Klasse, die Folgendes enthält:

remote_agent.api_resource mit Informationen zum bereitgestellten Agent. Sie können auch remote_agent.operation_schemas() aufrufen, um die Liste der Vorgänge zurückzugeben, die von remote_agent unterstützt werden. Weitere Informationen finden Sie unter Unterstützte Vorgänge.
remote_agent.api_client, die synchrone Dienstinteraktionen ermöglicht
remote_agent.async_api_client, die asynchrone Dienstinteraktionen ermöglicht

Optional: Agent-Ressourcen-ID abrufen

Jeder bereitgestellte Agent hat eine eindeutige Kennung. Sie können den folgenden Befehl ausführen, um den Ressourcennamen für Ihren bereitgestellten Agenten abzurufen:

remote_agent.api_resource.name

Die Antwort sollte in etwa so aussehen:

"projects/PROJECT_NUMBER/locations/LOCATION/reasoningEngines/RESOURCE_ID"

Dabei gilt:

PROJECT_ID ist die Google Cloud Projekt-ID, in der der bereitgestellte Agent ausgeführt wird.
LOCATION ist die Region, in der der bereitgestellte Agent ausgeführt wird.
RESOURCE_ID ist die ID des bereitgestellten Agents als reasoningEngine-Ressource.

Optional: Unterstützte Vorgänge auflisten

Jeder bereitgestellte Agent hat eine Liste der unterstützten Vorgänge. Mit AgentEngine.operation_schemas können Sie die Liste der vom bereitgestellten Agent unterstützten Vorgänge abrufen:

remote_agent.operation_schemas()

Das Schema für jeden Vorgang ist ein Wörterbuch, in dem die Informationen einer Methode für den Agenten dokumentiert sind, die Sie aufrufen können. Die unterstützten Vorgänge hängen vom Framework ab, das Sie zum Entwickeln Ihres Agenten verwendet haben:

Optional: Berechtigungen für den bereitgestellten Agent erteilen

Wenn dem bereitgestellten Agent zusätzliche Berechtigungen erteilt werden müssen, folgen Sie der Anleitung unter Identität und Berechtigungen für Ihren Agent einrichten.

Nächste Schritte

Leitfaden

Bereitgestellte Agents verwalten

Hier erfahren Sie, wie Sie Agents verwalten, die in der verwalteten Laufzeit der Agent Platform bereitgestellt wurden.

Leitfaden

KI-Agenten verwenden

Einen Agent mit Agent Platform Runtime verwenden.

Agent bereitstellen Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Vorbereitung

Optional: Agent für die Bereitstellung konfigurieren

Paketanforderungen definieren

ADK

A2A

LangChain

LangGraph

AG2

LlamaIndex

Zusätzliche Pakete definieren

Umgebungsvariablen definieren

Wörterbuch

Liste

Benutzerdefinierte Ressourcenkontrollen definieren

Build-Optionen definieren

install_npx.sh

install_uvx.sh

install_gcloud_cli.sh

Agent-Framework definieren

Cloud Storage-Ordner definieren

Anzeigenamen definieren

Beschreibung definieren

Labels definieren

Standardidentität für KI‑Agenten konfigurieren

Benutzerdefiniertes Dienstkonto konfigurieren

Private Service Connect-Schnittstelle konfigurieren

Kundenverwaltete Verschlüsselungsschlüssel konfigurieren

Git-Repository-Link von Developer Connect einrichten

Agent Platform-Instanz erstellen

Python-Objekt

Developer Connect

Quelldateien

Dockerfile

Container-Image

Optional: Agent-Ressourcen-ID abrufen

Optional: Unterstützte Vorgänge auflisten

Optional: Berechtigungen für den bereitgestellten Agent erteilen

Nächste Schritte

Bereitgestellte Agents verwalten

KI-Agenten verwenden

Agent bereitstellen