Reservierungen mit Agent Platform Workbench-Instanzen verwenden
In diesem Dokument wird erläutert, wie Sie Compute Engine-Reservierungen verwenden können, um sicherzustellen, dass Ihre Gemini Enterprise Agent Platform Workbench-Instanzen genügend VM-Ressourcen (Virtual Machine) haben, um ausgeführt zu werden.
Reservierungen sind eine Compute Engine-Funktion. Sie sorgen dafür, dass die Ressourcen jederzeit verfügbar sind, die Sie zum Erstellen von VMs mit derselben Hardware (Arbeitsspeicher und vCPUs) und optionalen Ressourcen (GPUs und lokalen SSD-Laufwerken) benötigen.
Wenn Sie eine Reservierung erstellen, prüft Compute Engine, ob die angeforderte Kapazität in der angegebenen Zone verfügbar ist. Wenn dies der Fall ist, reserviert Compute Engine die Ressourcen, erstellt die Reservierung und Folgendes geschieht:
Die reservierten Ressourcen sind sofort für Sie verfügbar und bleiben es, bis Sie die Reservierung löschen.
Ihnen werden die reservierten Ressourcen zum gleichen On-Demand-Tarif wie laufende VMs in Rechnung gestellt, einschließlich aller anwendbaren Rabatte, bis die Reservierung gelöscht wird. Während der Nutzung einer Reservierung fallen für eine VM keine doppelten Ressourcengebühren an, da der Reservierung die Kosten für die reservierten Ressourcen bereits in Rechnung gestellt werden. Weitere Informationen finden Sie unter siehe Reservierungen von zonalen Compute Engine Ressourcen.
Beschränkungen und Anforderungen
Alle Einschränkungen von Compute Engine-Reservierungen gelten, wenn Agent Platform Workbench-Instanzen Reservierungen nutzen. Siehe Funktionsweise von Reservierungen.
Wenn Sie Reservierungen mit Agent Platform Workbench-Instanzen verwenden, gelten außerdem die folgenden Einschränkungen und Anforderungen:
Ihre Reservierung muss eine der folgenden sein:
- Im selben Projekt wie Ihre Agent Platform Workbench-Instanz.
- Für dasselbe Projekt wie Ihre Agent Platform Workbench-Instanz freigegeben.
Die VM-Eigenschaften einer Reservierung müssen genau mit Ihrer Agent Platform Workbench-Instanz übereinstimmen, damit die Reservierung genutzt werden kann. Wenn in einer Reservierung beispielsweise der Maschinentyp
e2-standard-8angegeben ist, kann die Agent Platform Workbench-Instanz die Reservierung nur nutzen, wenn sie ebenfalls den Maschinentype2-standard-8verwendet. Siehe Anforderungen.
Hinweis
- Informationen zu den Anforderungen und Einschränkungen für Reservierungen
- Informationen zu den Kontingentanforderungen und -einschränkungen für freigegebene Reservierungen.
- Melden Sie sich in Ihrem Google Cloud Konto an. Wenn Sie noch kein Google Cloud-Nutzer sind, erstellen Sie ein Konto, um zu sehen, wie sich unsere Produkte in realen Szenarien schlagen. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für das Projekt zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Verwenden von Reservierungen mit Agent Platform Workbench-Instanzen benötigen:
- Compute-Administrator (
roles/compute.admin) - Notebooks-Administrator (
roles/notebooks.admin)
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Reservierung erstellen
Erstellen Sie eine Compute Engine-Reservierung. Es kann sich um eine Reservierung für ein einzelnes Projekt oder eine freigegebene Reservierung handeln. Die Reservierung kann eine On-Demand-Reservierung oder eine zukünftige Reservierung sein. Weitere Informationen finden Sie unter Reservierungstyp auswählen.
Reservierung mit einer neuen Instanz verwenden
Wenn Sie eine Agent Platform Workbench-Instanz erstellen möchten, die eine Reservierung nutzt, können Sie die Google Cloud Console oder die REST API verwenden.
Console
So erstellen Sie eine Agent Platform Workbench-Instanz, die eine Reservierung nutzt:
Rufen Sie in der Google Cloud Console die Seite Instanzen auf.
Klicken Sie auf NEU ERSTELLEN.
Klicken Sie im Dialogfeld Neue Instanz auf Erweiterte Optionen.
Wählen Sie im Dialogfeld Instanz erstellen im Abschnitt Maschinentyp den Maschinentyp und die GPU-Konfiguration aus, die Ihrer Reservierung entsprechen.
Wählen Sie unter CPU-Plattform und GPU im Menü Reservierungen die Reservierung aus, die Sie nutzen möchten.
Klicken Sie auf Erstellen.
Agent Platform Workbench erstellt eine Instanz und startet sie automatisch. Sobald die Instanz einsatzbereit ist, aktiviert Agent Platform Workbench den Link JupyterLab öffnen.
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
PROJECT_ID: Ihre Projekt-ID.LOCATION: Zone, in der sich Ihre Instanz befindet.INSTANCE_NAME: durch den Namen der InstanzMACHINE_TYPE: den Maschinentyp Ihrer InstanzRESERVATION_TYPE: den Reservierungstyp. MussRESERVATION_ANYoderRESERVATION_SPECIFICsein.RESERVATION_NAME: den Namen Ihrer Reservierung, wenn Sie denRESERVATION_SPECIFICTyp verwenden.- Bei Reservierungen im selben Projekt können Sie die Reservierungs-ID verwenden.
- Bei Reservierungen in einem anderen Projekt müssen Sie den vollständigen Reservierungspfad verwenden. Zum
Beispiel:
projects/PROJECT_ID/reservations/RESERVATION_NAME.
HTTP-Methode und URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
JSON-Text der Anfrage:
{
"gce_setup": {
"machine_type": "MACHINE_TYPE",
"reservation_affinity": {
"consume_reservation_type": "RESERVATION_TYPE",
"key": "compute.googleapis.com/reservation-name",
"values": ["RESERVATION_NAME"]
}
}
}
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Weitere Informationen finden Sie in der projects.locations.instances.create REST API
Dokumentation.
Reservierung nicht mehr verwenden
Wenn Sie Ihre Reservierung nicht mehr verwenden möchten, können Sie sie löschen.
Wenn Sie Ihre Reservierung weiterhin mit anderen Ressourcen verwenden möchten, sie aber nicht von Ihrer vorhandenen Agent Platform Workbench-Instanz verwendet werden soll, müssen Sie die Instanz löschen.
Abrechnung
Wenn Sie eine Compute Engine-Reservierung nutzen, werden Ihnen Folgendes in Rechnung gestellt:
Die Compute Engine-Ressourcen, einschließlich aller anwendbaren Rabatte für zugesicherte Nutzung (Committed Use Discount, CUD), zu den Compute Engine-Preisen. Diese Gebühren haben das Label
goog-vertex-ai-product: workbench-instancesin der SKU. Siehe Compute Engine-Preise.Zusätzlich zur Nutzung der Infrastruktur fallen die in den nachstehenden Tabellen aufgeführten Gebühren für die Verwaltung von Agent Platform Workbench an. Siehe Preise für die Agent Platform Workbench.
Fehlerbehebung
Informationen zur Diagnose und Behebung von Fehlern im Zusammenhang mit der Verwendung von Reservierungen mit Agent Platform Workbench-Instanzen finden Sie unter Fehlerbehebung bei Agent Platform Workbench-Instanzen.
Nächste Schritte
- Weitere Informationen zu Compute Engine-Reservierungen finden Sie unter Reservierungen von zonalen Compute Engine-Ressourcen.