Reservierung nutzen

Wenn Sie eine TPU-Reservierung haben, können Sie die reservierten Ressourcen verwenden, um TPUs zu erstellen, die den Attributen der Reservierung entsprechen. Diese Aktion wird als Reservierung nutzen bezeichnet. Informationen zum Verwenden einer TPU-Reservierung bei zeitgleicher Verwendung von Google Kubernetes Engine (GKE) finden Sie in der GKE-Dokumentation unter TPU-Reservierung.

Wie Sie eine Reservierung nutzen, hängt davon ab, wie Sie Ihre TPU-VMs erstellen. Sie können TPU-VM-Instanzen oder eine MIG mit TPUs erstellen.

Reservierung beim Erstellen einer TPU-VM verwenden

Wenn Sie eine TPU-VM-Instanz erstellen, geben Sie die zu verwendende Reservierung mit den Parametern --reservation-affinity und --reservation an:

  gcloud compute instances create TPU_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --zone=ZONE \
    --reservation-affinity=specific \
    --reservation=projects/PROJECT_ID/reservations/RESERVATION_NAME \
    --provisioning-model=reservation-bound \
    --maintenance-policy=TERMINATE

Ersetzen Sie die folgenden Platzhalter:

  • TPU_NAME: Der Name Ihrer TPU-VM.
  • MACHINE_TYPE: Der Maschinentyp für die TPU-VM (z. B. ct6e-standard-8t).
  • IMAGE_FAMILY: Die Betriebssystem-Image-Familie für die TPU-VM. Wenn Sie eine bestimmte Betriebssystemversion installieren möchten, verwenden Sie das Flag --image. Weitere Informationen zu Betriebssystem-Images finden Sie unter Betriebssystem-Images.
  • IMAGE_PROJECT: Das Projekt, das das Betriebssystem-Image enthält. Bei TPU-Images ist dies ubuntu-os-accelerator-images.
  • ZONE: Die Zone für die TPU-VM, z. B. „us-central1-b“.
  • PROJECT_ID: Die ID des Projekts, für das die Reservierung vorgenommen wurde.
  • RESERVATION_NAME: Der Name der Reservierung im Format projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.

Reservierung beim Erstellen einer verwalteten Instanzgruppe nutzen

Sie können zwei Arten von MIGs mit TPU-VMs erstellen:

  • MIGs mit Slices mit einem einzelnen Host.
  • MIGs mit einem Slice mit mehreren Hosts.

Reservierung verwenden, wenn Sie eine MIG mit Single-Host-Slices erstellen

Wenn Sie eine Reservierung nutzen möchten, wenn Sie eine verwaltete Instanzgruppe mit Single-Host-Slices erstellen, geben Sie die Reservierung als Teil der Instanzvorlage an.

So erstellen Sie eine MIG mit Single-Host-Slices:

  1. Instanzvorlage erstellen
  2. Optional: Arbeitslastrichtlinie erstellen
  3. Verwaltete Instanzgruppe erstellen

Instanzvorlage erstellen, die eine Reservierung nutzt

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
     --machine-type=MACHINE_TYPE \
     --maintenance-policy=TERMINATE \
     --instance-termination-action=DELETE \
     --reservation-affinity=specific \
     --provisioning-model=reservation-bound \
     --reservation=RESERVATION_NAME \
     --image-family=IMAGE_FAMILY \
     --image-project=IMAGE_PROJECT

Ersetzen Sie die folgenden Platzhalter:

  • INSTANCE_TEMPLATE_NAME: Der Name Ihrer Instanzvorlage.
  • MACHINE_TYPE: Der Maschinentyp für die TPU-VM, z. B. ct6e-standard-8t.
  • RESERVATION_NAME: Der Name der Reservierung im Format projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.
  • IMAGE_FAMILY: Die Betriebssystem-Image-Familie für die TPU-VM. Wenn Sie eine bestimmte Betriebssystemversion installieren möchten, verwenden Sie das Flag --image. Weitere Informationen zu Betriebssystem-Images finden Sie unter Betriebssystem-Images.
  • IMAGE_PROJECT: Das Projekt, das das Betriebssystem-Image enthält. Bei TPU-Images ist dies ubuntu-os-accelerator-images.

MIG erstellen

Sie können eine zonale MIG oder eine regionale MIG erstellen.

Eine zonale MIG erstellen
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --template=INSTANCE_TEMPLATE_NAME \
    --zone=ZONE

Ersetzen Sie die folgenden Platzhalter:

  • MIG_NAME: Name der MIG.
  • SIZE: Die Anzahl der TPU-VMs in der MIG.
  • INSTANCE_TEMPLATE_NAME: Der Name Ihrer Instanzvorlage.
  • ZONE: Die Zone, in der die MIG bereitgestellt werden soll.
Eine regionale MIG erstellen
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --template=INSTANCE_TEMPLATE_NAME\
    --region=REGION \
    --target-distribution-shape=any

Ersetzen Sie die folgenden Platzhalter:

  • MIG_NAME: Name der MIG.
  • SIZE: Die Anzahl der TPU-VMs in der MIG.
  • INSTANCE_TEMPLATE_NAME: Der Name Ihrer Instanzvorlage.
  • REGION: Die Zone, in der die MIG bereitgestellt werden soll.

Weitere Informationen zum Flag --target-distribution-shape finden Sie unter Zielverteilungsform für VMs in einer regionalen MIG festlegen.

Reservierung nutzen, wenn Sie eine verwaltete Instanzgruppe mit einem Multi-Host-Slice erstellen

Wenn Sie eine Reservierung nutzen möchten, wenn Sie eine MIG mit einem Multi-Host-Slice erstellen, geben Sie die Reservierung als Teil der Instanzvorlage an.

Instanzvorlage erstellen, die eine Reservierung nutzt

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
     --machine-type=MACHINE_TYPE \
     --maintenance-policy=TERMINATE \
     --instance-termination-action=DELETE \
     --reservation-affinity=specific \
     --provisioning-model=reservation-bound \
     --reservation=RESERVATION_NAME \
     --image-family=IMAGE_FAMILY \
     --image-project=IMAGE_PROJECT

Ersetzen Sie die folgenden Platzhalter:

  • INSTANCE_TEMPLATE_NAME: Der Name Ihrer Instanzvorlage.
  • MACHINE_TYPE: Der Maschinentyp für die TPU-VM, z. B. ct6e-standard-8t.
  • RESERVATION_NAME: Der Name der Reservierung im Format projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME.
  • IMAGE_FAMILY: Die Betriebssystem-Image-Familie für die TPU-VM. Wenn Sie eine bestimmte Betriebssystemversion installieren möchten, verwenden Sie das Flag --image. Weitere Informationen zu Betriebssystem-Images finden Sie unter Betriebssystem-Images.
  • IMAGE_PROJECT: Das Projekt, das das Betriebssystem-Image enthält. Bei TPU-Images ist dies ubuntu-os-accelerator-images.

Arbeitslastrichtlinie erstellen

Sie können eine Arbeitslastrichtlinie für Ihre MIGs angeben. Weitere Informationen finden Sie unter Arbeitslastrichtlinie für MIGs.

gcloud compute resource-policies create workload WORKLOAD_POLICY_NAME \
  --type=high-throughput \
  --accelerator-topology=TOPOLOGY

Ersetzen Sie die folgenden Platzhalter:

  • WORKLOAD_POLICY_NAME: Ein Name für Ihre Arbeitslastrichtlinie.
  • TOPOLOGY: Die Topologie der TPU-VMs, z. B. 4x4x8. Weitere Informationen zur Topologie für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.

MIG erstellen

Sie können eine zonale oder regionale MIG erstellen.

Eine zonale MIG erstellen
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --target-size-policy-mode=bulk \
    --default-action-on-vm-failure=do-nothing \
    --template=INSTANCE_TEMPLATE_URL \
    --zone=ZONE \
    --workload-policy=WORKLOAD_POLICY_URL

Ersetzen Sie die folgenden Platzhalter:

  • MIG_NAME: Name der MIG.
  • SIZE: Die Anzahl der TPU-VMs in der MIG.
  • INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von Instanzen in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
    • Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
  • ZONE: Die Zone, in der die MIG bereitgestellt werden soll.
  • WORKLOAD_POLICY_URL: Die URL der Arbeitslastrichtlinie, die Sie zum Erstellen von Instanzen in der MIG verwenden möchten. Beispiel: projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME
Eine regionale MIG erstellen
gcloud compute instance-groups managed create MIG_NAME \
    --size=SIZE \
    --target-size-policy-mode=bulk \
    --default-action-on-vm-failure=do-nothing \
    --template=INSTANCE_TEMPLATE_URL \
    --zone=ZONE \
    --target-distribution-shape=any-single-zone \
    --instance-redistribution-type=none \
    --workload-policy=WORKLOAD_POLICY_URL

Ersetzen Sie die folgenden Platzhalter:

  • MIG_NAME: Name der MIG.
  • SIZE: Die Anzahl der TPU-VMs in der MIG.
  • INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von Instanzen in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
    • Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
  • ZONE: Die Zone, in der die MIG bereitgestellt werden soll.
  • WORKLOAD_POLICY_URL: Die URL der Arbeitslastrichtlinie, die Sie zum Erstellen von Instanzen in der MIG verwenden möchten. For example: projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME

Reservierungsnutzung prüfen

Die Verwendung einer freigegebenen Reservierung kann nur über das Inhaberprojekt geprüft werden. Wenn Sie sich in einem Nutzerprojekt befinden, müssen Sie zum Inhaberprojekt wechseln, um die Reservierungsnutzung zu prüfen.

Mit dem Befehl gcloud compute reservations describe können Sie sehen, wie viel von der Reservierung verwendet wird:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Ersetzen Sie folgende Platzhaltervariablen:

  • RESERVATION_NAME: Der Name der Reservierung.
  • PROJECT_ID: Die ID des Projekts, das die Reservierung enthält.
  • ZONE: Die Zone, in der die Reservierung vorhanden ist.

Verwenden Sie den Befehl gcloud compute reservations list, um alle Reservierungen in einem Projekt aufzulisten:

gcloud compute reservations list --project=PROJECT_ID

Ersetzen Sie die folgende Platzhaltervariable:

  • PROJECT_ID: Die ID des Projekts.

Weitere Informationen