HPC-MIG mit H4D-Maschinenserie erstellen

In diesem Dokument wird beschrieben, wie Sie eine verwaltete Instanzgruppe (MIG) erstellen, die einen H4D-Maschinentyp verwendet.

Wenn Sie eine MIG erstellen, können Sie mehrere VMs als eine einzelne Entität verwalten. Jede VM in einer MIG basiert auf einer Instanzvorlage. Durch die automatische Verwaltung der VMs in der Gruppe bieten MIGs Hochverfügbarkeit und Skalierbarkeit. Weitere Informationen zu MIGs finden Sie unter Verwaltete Instanzgruppen.

Informationen zu den Optionen zum Erstellen von HPC-VMs und HPC-Clustern finden Sie unter HPC-Cluster erstellen – Übersicht.

Wenn Sie eine MIG erstellen möchten, aber keine H4D-Maschinentypen verwenden oder keine dichte Bereitstellung von Instanzen benötigen, lesen Sie den Abschnitt Grundlegende Szenarien zum Erstellen verwalteter Instanzgruppen (MIGs).

Hinweise

  • Verbrauchsoption auswählen: Wenn Sie Compute-Instanzen im Bulk erstellen und erweiterte Clusterverwaltungsfunktionen aktivieren möchten, können Sie eine vorausschauende Reservierung im Kalendermodus oder Spot-VMs auswählen.

    Wenn Sie Spot-VMs verwenden, werden die VMs möglicherweise nicht kompakt nebeneinander platziert. Außerdem können Spot-VMs nach Bedarf vorzeitig beendet werden und sind nicht für die Verwaltung von Hostwartungsereignissen für Gruppen von VMs geeignet.

  • Kapazität abrufen: Der Prozess zum Abrufen von Kapazität unterscheidet sich für jede Verbrauchsoption.

    Weitere Informationen finden Sie unter Nutzungsoption auswählen und Kapazität erhalten.

  • Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud Dienste und APIs überprüft. Zum Ausführen von Code oder Beispielen aus einer lokalen Entwicklungsumgebung können Sie sich so bei der Compute Engine authentifizieren:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    gcloud

    1. Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:

      gcloud init

      Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

    2. Set a default region and zone.

    REST

    Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.

      Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:

      gcloud init

      Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

    Weitere Informationen finden Sie in der Dokumentation zur Google Cloud -Authentifizierung unter Für die Verwendung von REST authentifizieren.

Übersicht

Das Erstellen einer MIG mit dem Maschinentyp „H4D“ umfasst die folgenden Schritte:

  1. VPC-Netzwerke erstellen
  2. Optional: Workload-Richtlinie erstellen
  3. Instanzvorlage erstellen
  4. Eine MIG erstellen

Beschränkungen

Wenn Sie eine MIG mit H4D-VMs erstellen, gelten die folgenden Einschränkungen:

  • Wenn in der Instanzvorlage, die für die verwaltete Instanzgruppe verwendet werden soll, das Bereitstellungsmodell „Flex-Start“ angegeben ist, gelten die folgenden Einschränkungen:

    • Sie können der MIG nur VMs hinzufügen, indem Sie Anfragen zur Größenanpassung verwenden.

    • Sie können keine Arbeitslastrichtlinie auf die MIG anwenden.

    • Sie müssen Reparaturen in der MIG deaktivieren.

  • Wenn Sie eine regionale MIG erstellen, können mit der MIG nur VMs in der Zone erstellt werden, die das Profil Ihres VPC-Netzwerks enthält.

  • Sie können die Instanzflexibilität in der MIG nicht konfigurieren.

  • Wenn Sie eine Arbeitslastrichtlinie auf eine verwaltete Instanzgruppe anwenden, können Sie die Richtlinie in der verwalteten Instanzgruppe nicht ändern, wenn die Gruppe VMs enthält. Wenn Sie die Richtlinie in einer MIG mit VMs ändern möchten, müssen Sie die MIG zuerst auf null skalieren.

  • Sie können keine Instanzvorlage verwenden, die eine Platzierungsrichtlinie angibt, um eine MIG zu erstellen, die eine Arbeitslastrichtlinie verwendet.

  • Beim Erstellen von Anfragen zur Größenänderung für MIGs gelten die folgenden Einschränkungen:

    • In einer regionalen MIG können Sie nur die ANY_SINGLE_ZONE Zielverteilungsform (Vorschau) verwenden. Andere Verteilungsformen werden nicht unterstützt.

    • Sie können den Stand‑by-Pool-Modus der verwalteten Instanzgruppe nur auf manual (Standardwert) festlegen.

    • Sie können Autoscaling nicht festlegen.

    • Wenn die MIG akzeptierte Anfragen zur Größenanpassung enthält, können Sie Folgendes nicht tun:

      • Sie können keine zweite Instanzvorlage hinzufügen, um ein Canary Update in der MIG zu initiieren.

      • Sie können die Zielgröße der MIG nicht ändern.

    • Sie können die verwalteten Instanzen mit dem Status CREATING, die von der MIG für eine Anfrage zur Größenanpassung erstellt werden, nicht löschen oder verwerfen. Wenn Sie diese verwalteten Instanzen löschen möchten, müssen Sie die Anfrage zur Größenanpassung abbrechen.

Optional: VPC-Netzwerke erstellen

Beim Erstellen einer Compute-Instanz können Sie ein VPC-Netzwerk und ein Subnetz angeben. Wenn Sie diese Konfiguration weglassen, werden das Standardnetzwerk und das Standardsubnetz verwendet.

Wenn Sie die H4D-Instanzen in der MIG für die Verwendung von Cloud RDMA konfigurieren möchten, führen Sie die Schritte in diesem Abschnitt aus. Andernfalls können Sie diesen Abschnitt überspringen und das Standardnetzwerk verwenden.

Wenn Sie Cloud RDMA mit H4D-Instanzen verwenden möchten, müssen Sie mindestens zwei Netzwerke konfigurieren, eines für jeden Typ von Netzwerkschnittstelle:

  • NIC-Typ GVNIC: verwendet den Treiber gve für TCP/IP- und Internet-Traffic für die normale VM-VM- und VM-Internet-Kommunikation.
  • NIC-Typ IRDMA: Verwendet IDPF-/iRDMA-Treiber für Cloud RDMA-Netzwerke zwischen Instanzen.

Instanzen, die Cloud RDMA verwenden, können nur eine IRDMA-Schnittstelle haben. Sie können bis zu acht zusätzliche GVNIC-Netzwerkschnittstellen hinzufügen, sodass insgesamt 10 vNICs pro Instanz möglich sind.

Sie können die Falcon-VPC-Netzwerke für die Verwendung mit Ihren Instanzen entweder anhand der dokumentierten Anleitung einrichten oder das bereitgestellte Skript verwenden.

Anleitungen

So erstellen Sie die Netzwerke:

Skript

Sie können pro Instanz bis zu neun gVNIC-Netzwerkschnittstellen und eine IRDMA-Netzwerkschnittstelle erstellen. Jede Netzwerkschnittstelle muss mit einem separaten Netzwerk verbunden sein. Sie können die Netzwerke mit dem folgenden Skript erstellen, das zwei Netzwerke für gVNIC und ein Netzwerk für IRDMA erstellt.

  1. Optional: Bevor Sie das Skript ausführen, können Sie die Falcon VPC-Netzwerkprofile auflisten, um zu prüfen, ob eines verfügbar ist.
      gcloud compute network-profiles list
      
  2. Kopieren Sie den folgenden Code und führen Sie ihn in einem Linux-Shell-Fenster aus.

      #!/bin/bash
      # Set the number of GVNIC interfaces to create. You can create up to 9.
      NUM_GVNIC=NUMBER_OF_GVNIC
    
      # Create regular VPC networks and subnets for the GVNIC interfaces
        for N in $(seq 0 $(($NUM_GVNIC - 1))); do
          gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \
              --subnet-mode=custom
    
          gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \
              --network=GVNIC_NAME_PREFIX-net-$N \
              --region=REGION \
              --range=10.$N.0.0/16
    
          gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \
              --network=GVNIC_NAME_PREFIX-net-$N \
              --action=ALLOW \
              --rules=tcp:0-65535,udp:0-65535,icmp \
              --source-ranges=10.0.0.0/8
      done
    
      # Create SSH firewall rules
      gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \
          --network=GVNIC_NAME_PREFIX-net-0 \
          --action=ALLOW \
          --rules=tcp:22 \
          --source-ranges=IP_RANGE
    
      # Optional: Create a firewall rule for the external IP address for the
      #  first GVNIC network interface
      gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \
          --network=GVNIC_NAME_PREFIX-net-0 \
          --action=ALLOW \
          --rules=icmp \
          --source-ranges=IP_RANGE
    
      # Create a Falcon VPC network for the Cloud RDMA network interface
      gcloud compute networks create RDMA_NAME_PREFIX-irdma \
          --network-profile=ZONE-vpc-falcon \
          --subnet-mode custom
    
      # Create a subnet in the Falcon VPC network
      gcloud compute networks subnets create RDMA_NAME_PREFIX-irdma-sub \
          --network=RDMA_NAME_PREFIX-irdma \
          --region=REGION \
          --range=10.2.0.0/16  # offset to avoid overlap with GVNIC subnet ranges
      

    Ersetzen Sie Folgendes:

    • NUMBER_OF_GVNIC: die Anzahl der zu erstellenden GVNIC-Schnittstellen. Geben Sie eine Zahl zwischen 1 und 9 an.
    • GVNIC_NAME_PREFIX: Das Namenspräfix, das für das reguläre VPC-Netzwerk und -Subnetz verwendet werden soll, das den NIC-Typ „GVNIC“ verwendet.
    • REGION: Die Region, in der Sie die Netzwerke erstellen möchten. Dies muss der Zone entsprechen, die beim Erstellen des Falcon-VPC-Netzwerks für das Flag --network-profile angegeben wurde. Wenn Sie beispielsweise die Zone als europe-west4-b angeben, lautet Ihre Region europe-west4.
    • IP_RANGE: Der Bereich der IP-Adressen außerhalb des VPC-Netzwerk, der für die SSH-Firewallregeln verwendet werden soll. Als Best Practice sollten Sie statt aller IPv4- oder IPv6-Quellen die spezifischen IP-Adressbereiche angeben, von denen aus Sie Zugriff gewähren möchten. Verwenden Sie nicht 0.0.0.0/0 oder ::/0 als Quellbereich, da dadurch Traffic von allen IPv4- oder IPv6-Quellen zugelassen wird, einschließlich Quellen außerhalb von Google Cloud.
    • RDMA_NAME_PREFIX: Das Namenspräfix, das für das VPC-Netzwerk und das Subnetz verwendet werden soll, die den IRDMA-NIC-Typ verwenden.
    • ZONE: Die Zone, in der Sie die Netzwerke und Compute-Instanzen erstellen möchten. Verwenden Sie entweder us-central1-a oder europe-west4-b.
  3. Optional: Wenn Sie prüfen möchten, ob die VPC-Netzwerkressourcen erfolgreich erstellt wurden, sehen Sie sich die Netzwerkeinstellungen in der Google Cloud Console an:

    1. Rufen Sie in der Google Cloud Console die Seite VPC-Netzwerke auf.

      Zur Seite VPC-Netzwerke

    2. Suchen Sie in der Liste nach den Netzwerken, die Sie im vorherigen Schritt erstellt haben.
    3. Klicken Sie auf den Namen des Netzwerks, um die Subnetze, Firewallregeln und andere Netzwerkeinstellungen aufzurufen.

Optional: Arbeitslastrichtlinie erstellen

Wenn Sie möchten, dass Compute Engine VM-Instanzen in einem einzelnen Block oder in benachbarten Blöcken platziert, geben Sie die Instanzplatzierung an, indem Sie eine Arbeitslastrichtlinie erstellen. Wenn Sie jedoch möchten, dass Compute Engine Ihre Instanzen in einem bestimmten Block platziert, überspringen Sie diesen Schritt und geben Sie den Namen des Blocks in der Reservierungsaffinität an, wenn Sie die Instanzvorlage erstellen.

Wenn Sie bereits eine Arbeitslastrichtlinie haben, können Sie sie wiederverwenden. Wenn Sie eine Arbeitslastrichtlinie auf Ihre MIG anwenden, versucht Compute Engine, Instanzen zu erstellen, die so nah wie möglich beieinander liegen. Wenn Ihre Anwendung latenzempfindlich ist und Sie möchten, dass die Instanzen näher beieinander liegen (maximale Kompaktheit), geben Sie beim Erstellen einer Arbeitslastrichtlinie das Feld maxTopologyDistance an.

Sie können eine Arbeitslastrichtlinie nach dem Erstellen nicht mehr aktualisieren. Wenn Sie Änderungen an einer Arbeitslastrichtlinie vornehmen möchten, müssen Sie eine neue erstellen.

Wählen Sie eine der folgenden Optionen aus, um eine Arbeitslastrichtlinie zu erstellen:

gcloud

Verwenden Sie zum Erstellen einer Workload-Richtlinie den Befehl gcloud compute resource-policies create workload-policy.

  • Wenn Sie eine Best-Effort-Platzierung von VMs wünschen, geben Sie im Befehl nur das Flag --type=high-throughput an:

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --type=high-throughput \
        --region=REGION
    
  • Geben Sie für die strikte Colocation von VMs das Flag --max-topology-distance im Befehl an:

    gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
        --type=high-throughput \
        --max-topology-distance=TOPOLOGY_DISTANCE \
        --region=REGION
    

Ersetzen Sie Folgendes:

  • WORKLOAD_POLICY_NAME: Der Name der Arbeitslastrichtlinie.
  • REGION: Die Region, in der Sie die Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen und Zonen finden Sie unter Verfügbare Regionen und Zonen.

REST

Senden Sie zum Erstellen einer Arbeitslastrichtlinie eine POST-Anfrage an die Methode resourcePolicies.insert.

  • Wenn Sie eine Best-Effort-Platzierung von VMs wünschen, geben Sie im Antrag nur das Feld type an:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
      {
        "name": "WORKLOAD_POLICY_NAME"
        "workloadPolicy": {
          "type": "HIGH_THROUGHPUT"
        }
      }
    
  • Wenn Sie VMs strikt nebeneinander platzieren möchten, geben Sie das Feld maxTopologyDistance in der Anfrage so an:

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
      {
        "name": "WORKLOAD_POLICY_NAME"
        "workloadPolicy": {
          "type": "HIGH_THROUGHPUT",
          "maxTopologyDistance": "TOPOLOGY_DISTANCE"
        }
      }
    

Ersetzen Sie Folgendes:

  • PROJECT_ID: Ihre Projekt-ID.
  • REGION: Die Region, in der Sie die Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen und Zonen finden Sie unter Verfügbare Regionen und Zonen.
  • WORKLOAD_POLICY_NAME: Der Name der Arbeitslastrichtlinie.

Instanzvorlage erstellen

Wenn Sie die Instanz- und Verbrauchsattribute für jede Instanz in der verwalteten Instanzgruppe angeben möchten, erstellen Sie eine Instanzvorlage mit einer der folgenden Methoden.

Mit den folgenden Befehlen wird auch der Zugriffsbereich für Ihre Instanzen festgelegt. Um die Berechtigungsverwaltung zu vereinfachen, empfiehlt Google, den Zugriffsbereich für eine Instanz auf cloud-platform-Zugriff festzulegen und dann mit IAM-Rollen zu definieren, auf welche Dienste die Instanz zugreifen kann. Weitere Informationen finden Sie unter Best Practices für Bereiche.

gcloud

Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der Ihrer Verbrauchsoption und Ihrem Bereitstellungsmodell entspricht.

Flex-Start

Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den Befehl gcloud compute instance-templates create.

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    
--network-interface=nic-type=GVNIC, \
      network=GVNIC_NAME_PREFIX-net-0, \
      subnet=GVNIC_NAME_PREFIX-sub-0, \
      stack-type=STACK_TYPE, \
      address=EXTERNAL_IPV4_ADDRESS \
--network-interface=nic-type=GVNIC, \
      network=GVNIC_NAME_PREFIX-net-1, \
      subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=IRDMA, \
      network=RDMA_NAME_PREFIX-irdma, \
      subnet=RDMA_NAME_PREFIX-irdma-sub, \
      stack-type=IPV4_ONLY,no-address \
    
    --reservation-affinity=none \
    --instance-termination-action=DELETE \
    --max-run-duration=RUN_DURATION \
    --maintenance-policy=TERMINATE \
    --provisioning-model=FLEX_START

Ersetzen Sie Folgendes:

  • INSTANCE_TEMPLATE_NAME ist der Name der Instanzvorlage.
  • MACHINE_TYPE: der für die Instanz zu verwendende H4D-Maschinentyp.
  • IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.
  • IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.
  • REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist.
  • DISK_SIZE: Die Größe des Bootlaufwerks in GiB.
  • GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze für die gVNIC-Schnittstellen verwendet haben.

    Wenn Sie das Standardnetzwerk verwenden, geben Sie nur ein einzelnes --network-interface-Feld an, wobei das Feld nic-type auf GVNIC festgelegt ist. Lassen Sie außerdem die Einstellungen network und subnetwork für diese Netzwerkschnittstelle weg.

  • STACK_TYPE (optional): der Stacktyp, der für die gVNIC-Schnittstelle verwendet werden soll. Geben Sie entweder IPV4_ONLY oder IPV4_IPV6 an. Wenn Sie keinen Wert angeben, wird standardmäßig IPV4_ONLY verwendet.
  • EXTERNAL_IPV4_ADDRESS (optional): Eine statische externe IPv4-Adresse, die mit der gVNIC-Netzwerkschnittstelle verwendet werden soll. Sie müssen zuvor eine externe IPv4-Adresse reserviert haben. Führen Sie einen der folgenden Schritte aus:

    • Geben Sie eine gültige IPv4-Adresse aus dem Subnetz an.
    • Verwenden Sie das Flag no-address, wenn die Netzwerkschnittstelle keine externe IP-Adresse haben soll.
    • Geben Sie address='' an, wenn die Netzwerkschnittstelle eine sitzungsspezifische externe IP-Adresse erhalten soll.

    Verwenden Sie stattdessen das Flag --external-ipv6-address, um eine externe IPv6-Adresse für die GVNIC-Netzwerkschnittstelle anzugeben.

  • RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen des VPC-Netzwerks und des Subnetzes für die IRDMA-Netzwerkschnittstelle verwendet haben.

    Wenn Sie Cloud RDMA nicht mit Ihren H4D-Instanzen verwenden, lassen Sie das Feld --network-interface für die IRDMA-Schnittstelle weg.

  • RUN_DURATION: die Dauer, für die die angeforderten Instanzen ausgeführt werden sollen. Sie müssen den Wert als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt von d, h, m bzw. s formatieren. Geben Sie beispielsweise 30m für 30 Minuten oder 1d2h3m4s für einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.

Reservierungsgebunden

Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den Befehl gcloud compute instance-templates create.

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    
--network-interface=nic-type=GVNIC, \
      network=GVNIC_NAME_PREFIX-net-0, \
      subnet=GVNIC_NAME_PREFIX-sub-0, \
      stack-type=STACK_TYPE, \
      address=EXTERNAL_IPV4_ADDRESS \
--network-interface=nic-type=GVNIC, \
      network=GVNIC_NAME_PREFIX-net-1, \
      subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=IRDMA, \
      network=RDMA_NAME_PREFIX-irdma, \
      subnet=RDMA_NAME_PREFIX-irdma-sub, \
      stack-type=IPV4_ONLY,no-address \
    --reservation-affinity=specific \
    --reservation=RESERVATION \
    --provisioning-model=RESERVATION_BOUND \
    --instance-termination-action=DELETE \
    --maintenance-policy=TERMINATE

Ersetzen Sie Folgendes:

  • INSTANCE_TEMPLATE_NAME ist der Name der Instanzvorlage.
  • MACHINE_TYPE: der für die Instanz zu verwendende H4D-Maschinentyp.
  • IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.
  • IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.
  • REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist.
  • DISK_SIZE: Die Größe des Bootlaufwerks in GiB.
  • GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze für die gVNIC-Schnittstellen verwendet haben.

    Wenn Sie das Standardnetzwerk verwenden, geben Sie nur ein einzelnes --network-interface-Feld an, wobei das Feld nic-type auf GVNIC festgelegt ist. Lassen Sie außerdem die Einstellungen network und subnetwork für diese Netzwerkschnittstelle weg.

  • STACK_TYPE (optional): der Stacktyp, der für die gVNIC-Schnittstelle verwendet werden soll. Geben Sie entweder IPV4_ONLY oder IPV4_IPV6 an. Wenn Sie keinen Wert angeben, wird standardmäßig IPV4_ONLY verwendet.
  • EXTERNAL_IPV4_ADDRESS (optional): Eine statische externe IPv4-Adresse, die mit der gVNIC-Netzwerkschnittstelle verwendet werden soll. Sie müssen zuvor eine externe IPv4-Adresse reserviert haben. Führen Sie einen der folgenden Schritte aus:

    • Geben Sie eine gültige IPv4-Adresse aus dem Subnetz an.
    • Verwenden Sie das Flag no-address, wenn die Netzwerkschnittstelle keine externe IP-Adresse haben soll.
    • Geben Sie address='' an, wenn die Netzwerkschnittstelle eine sitzungsspezifische externe IP-Adresse erhalten soll.

    Verwenden Sie stattdessen das Flag --external-ipv6-address, um eine externe IPv6-Adresse für die GVNIC-Netzwerkschnittstelle anzugeben.

  • RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen des VPC-Netzwerks und des Subnetzes für die IRDMA-Netzwerkschnittstelle verwendet haben.

    Wenn Sie Cloud RDMA nicht mit Ihren H4D-Instanzen verwenden, lassen Sie das Feld --network-interface für die IRDMA-Schnittstelle weg.

  • RESERVATION: Der Name der Reservierung, die Sie verwenden möchten.

    RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:
    • So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

      Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.

    • So erstellen Sie Instanzen auf einem bestimmten Block:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME

Spot

Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den Befehl gcloud compute instance-templates create.

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=MACHINE_TYPE \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT \
    --instance-template-region=REGION \
    --boot-disk-type=hyperdisk-balanced \
    --boot-disk-size=DISK_SIZE \
    --scopes=cloud-platform \
    
--network-interface=nic-type=GVNIC, \
      network=GVNIC_NAME_PREFIX-net-0, \
      subnet=GVNIC_NAME_PREFIX-sub-0, \
      stack-type=STACK_TYPE, \
      address=EXTERNAL_IPV4_ADDRESS \
--network-interface=nic-type=GVNIC, \
      network=GVNIC_NAME_PREFIX-net-1, \
      subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=IRDMA, \
      network=RDMA_NAME_PREFIX-irdma, \
      subnet=RDMA_NAME_PREFIX-irdma-sub, \
      stack-type=IPV4_ONLY,no-address \
    --provisioning-model=SPOT \
    --instance-termination-action=TERMINATION_ACTION

Ersetzen Sie Folgendes:

  • INSTANCE_TEMPLATE_NAME ist der Name der Instanzvorlage.
  • MACHINE_TYPE: der für die Instanz zu verwendende H4D-Maschinentyp.
  • IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.
  • IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.
  • REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist.
  • DISK_SIZE: Die Größe des Bootlaufwerks in GiB.
  • GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze für die gVNIC-Schnittstellen verwendet haben.

    Wenn Sie das Standardnetzwerk verwenden, geben Sie nur ein einzelnes --network-interface-Feld an, wobei das Feld nic-type auf GVNIC festgelegt ist. Lassen Sie außerdem die Einstellungen network und subnetwork für diese Netzwerkschnittstelle weg.

  • STACK_TYPE (optional): der Stacktyp, der für die gVNIC-Schnittstelle verwendet werden soll. Geben Sie entweder IPV4_ONLY oder IPV4_IPV6 an. Wenn Sie keinen Wert angeben, wird standardmäßig IPV4_ONLY verwendet.
  • EXTERNAL_IPV4_ADDRESS (optional): Eine statische externe IPv4-Adresse, die mit der gVNIC-Netzwerkschnittstelle verwendet werden soll. Sie müssen zuvor eine externe IPv4-Adresse reserviert haben. Führen Sie einen der folgenden Schritte aus:

    • Geben Sie eine gültige IPv4-Adresse aus dem Subnetz an.
    • Verwenden Sie das Flag no-address, wenn die Netzwerkschnittstelle keine externe IP-Adresse haben soll.
    • Geben Sie address='' an, wenn die Netzwerkschnittstelle eine sitzungsspezifische externe IP-Adresse erhalten soll.

    Verwenden Sie stattdessen das Flag --external-ipv6-address, um eine externe IPv6-Adresse für die GVNIC-Netzwerkschnittstelle anzugeben.

  • RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen des VPC-Netzwerks und des Subnetzes für die IRDMA-Netzwerkschnittstelle verwendet haben.

    Wenn Sie Cloud RDMA nicht mit Ihren H4D-Instanzen verwenden, lassen Sie das Feld --network-interface für die IRDMA-Schnittstelle weg.

  • TERMINATION_ACTION: Gibt an, ob Compute Engine die Spot-VMs bei einem Vorabzugriff beendet (STOP) oder löscht (DELETE).

REST

Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der Ihrer Verbrauchsoption und Ihrem Bereitstellungsmodell entspricht.

Flex-Start

Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die Methode regionInstanceTemplates.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "machineType":"MACHINE_TYPE",
    
        "networkInterfaces": [
        {
          "network": "GVNIC_NAME_PREFIX-net-0",
          "subnetwork": "GVNIC_NAME_PREFIX-sub-0",
          "accessConfigs": [
            {
                "type": "ONE_TO_ONE_NAT",
                "name": "External IP",
                "natIP": "EXTERNAL_IPV4_ADDRESS"
            }
          ],
          "stackType": "IPV4_ONLY",
          "nicType": "GVNIC",
      },
      {
          "network": "GVNIC_NAME_PREFIX-net-1",
          "subnetwork": "GVNIC_NAME_PREFIX-sub-1",
          "stackType": "IPV4_ONLY",
          "nicType": "GVNIC",
      },
      {
          "network": "RDMA_NAME_PREFIX-irdma",
          "subnetwork": "RDMA_NAME_PREFIX-irdma-sub",
          "stackType": "IPV4_ONLY",
          "nicType": "IRDMA",
      }
    ],
,
    "reservationAffinity": {
        "consumeReservationType": "NO_RESERVATION"
      },
    "scheduling": {
        "instanceTerminationAction": "DELETE",
        "maxRunDuration": {
          "seconds": RUN_DURATION
        },
        "onHostMaintenance": "TERMINATE",
        "provisioningModel": "FLEX_START"
      }

  }
}

Ersetzen Sie Folgendes:

  • INSTANCE_TEMPLATE_NAME ist der Name der Instanzvorlage.
  • MACHINE_TYPE: der für die Instanz zu verwendende Maschinentyp. Geben Sie einen H4D-Maschinentyp an. Weitere Informationen finden Sie unter H4D-Maschinentypen.
  • IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.
  • IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.
  • REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Weitere Informationen zu Regionen finden Sie unter Regionen und Zonen.
  • DISK_SIZE: Die Größe des Bootlaufwerks in GiB.
  • GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze für die gVNIC-Schnittstellen verwendet haben.

    Wenn Sie das Standardnetzwerk verwenden, geben Sie nur ein einzelnes --network-interface-Feld an, wobei das Feld nic-type auf GVNIC festgelegt ist. Lassen Sie außerdem die Einstellungen network und subnetwork für diese Netzwerkschnittstelle weg.

  • EXTERNAL_IPV4_ADDRESS (optional): Eine statische externe IPv4-Adresse, die mit der gVNIC-Netzwerkschnittstelle verwendet werden soll. Sie müssen zuvor eine externe IPv4-Adresse reserviert haben.

    Verwenden Sie stattdessen das Flag --external-ipv6-address, um eine externe IPv6-Adresse für die GVNIC-Netzwerkschnittstelle anzugeben.

  • RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen des VPC-Netzwerks und des Subnetzes für die IRDMA-Netzwerkschnittstelle verwendet haben.

    Wenn Sie Cloud RDMA nicht mit Ihren H4D-Instanzen verwenden, lassen Sie das Feld --network-interface für die IRDMA-Schnittstelle weg.

  • RUN_DURATION: die Dauer in Sekunden, für die die angeforderten Instanzen ausgeführt werden sollen. Der Wert muss zwischen 600, d. h. 600 Sekunden (10 Minuten) und 604800, also 604.800 Sekunden (7 Tage) liegen.

Reservierungsgebunden

Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die Methode regionInstanceTemplates.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "machineType":"MACHINE_TYPE",
    
        "networkInterfaces": [
        {
          "network": "GVNIC_NAME_PREFIX-net-0",
          "subnetwork": "GVNIC_NAME_PREFIX-sub-0",
          "accessConfigs": [
            {
                "type": "ONE_TO_ONE_NAT",
                "name": "External IP",
                "natIP": "EXTERNAL_IPV4_ADDRESS"
            }
          ],
          "stackType": "IPV4_ONLY",
          "nicType": "GVNIC",
      },
      {
          "network": "GVNIC_NAME_PREFIX-net-1",
          "subnetwork": "GVNIC_NAME_PREFIX-sub-1",
          "stackType": "IPV4_ONLY",
          "nicType": "GVNIC",
      },
      {
          "network": "RDMA_NAME_PREFIX-irdma",
          "subnetwork": "RDMA_NAME_PREFIX-irdma-sub",
          "stackType": "IPV4_ONLY",
          "nicType": "IRDMA",
      }
    ],
,
    "reservationAffinity":{
        "consumeReservationType":"SPECIFIC_RESERVATION",
        "key":"compute.googleapis.com/reservation-name",
        "values":[
          "RESERVATION"
        ]
      },
    "scheduling":{
        "provisioningModel":"RESERVATION_BOUND",
        "instanceTerminationAction":"DELETE",
        "onHostMaintenance": "TERMINATE",
        "automaticRestart":true
      }
  }
}

Ersetzen Sie Folgendes:

  • INSTANCE_TEMPLATE_NAME ist der Name der Instanzvorlage.
  • MACHINE_TYPE: der für die Instanz zu verwendende Maschinentyp. Geben Sie einen H4D-Maschinentyp an. Weitere Informationen finden Sie unter H4D-Maschinentypen.
  • IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.
  • IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.
  • REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Weitere Informationen zu Regionen finden Sie unter Regionen und Zonen.
  • DISK_SIZE: Die Größe des Bootlaufwerks in GiB.
  • GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze für die gVNIC-Schnittstellen verwendet haben.

    Wenn Sie das Standardnetzwerk verwenden, geben Sie nur ein einzelnes --network-interface-Feld an, wobei das Feld nic-type auf GVNIC festgelegt ist. Lassen Sie außerdem die Einstellungen network und subnetwork für diese Netzwerkschnittstelle weg.

  • EXTERNAL_IPV4_ADDRESS (optional): Eine statische externe IPv4-Adresse, die mit der gVNIC-Netzwerkschnittstelle verwendet werden soll. Sie müssen zuvor eine externe IPv4-Adresse reserviert haben.

    Verwenden Sie stattdessen das Flag --external-ipv6-address, um eine externe IPv6-Adresse für die GVNIC-Netzwerkschnittstelle anzugeben.

  • RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen des VPC-Netzwerks und des Subnetzes für die IRDMA-Netzwerkschnittstelle verwendet haben.

    Wenn Sie Cloud RDMA nicht mit Ihren H4D-Instanzen verwenden, lassen Sie das Feld --network-interface für die IRDMA-Schnittstelle weg.

  • RESERVATION: Der Name der Reservierung, die Sie verwenden möchten.

    RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:
    • So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME

      Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.

    • So erstellen Sie Instanzen auf einem bestimmten Block:

      projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME

Spot

Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die Methode regionInstanceTemplates.insert.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
  "name":"INSTANCE_TEMPLATE_NAME",
  "properties":{
    "disks":[
      {
        "boot":true,
        "initializeParams":{
          "diskSizeGb":"DISK_SIZE",
          "diskType":"hyperdisk-balanced",
          "sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
        },
        "mode":"READ_WRITE",
        "type":"PERSISTENT"
      }
    ],
    "machineType":"MACHINE_TYPE",
    
        "networkInterfaces": [
        {
          "network": "GVNIC_NAME_PREFIX-net-0",
          "subnetwork": "GVNIC_NAME_PREFIX-sub-0",
          "accessConfigs": [
            {
                "type": "ONE_TO_ONE_NAT",
                "name": "External IP",
                "natIP": "EXTERNAL_IPV4_ADDRESS"
            }
          ],
          "stackType": "IPV4_ONLY",
          "nicType": "GVNIC",
      },
      {
          "network": "GVNIC_NAME_PREFIX-net-1",
          "subnetwork": "GVNIC_NAME_PREFIX-sub-1",
          "stackType": "IPV4_ONLY",
          "nicType": "GVNIC",
      },
      {
          "network": "RDMA_NAME_PREFIX-irdma",
          "subnetwork": "RDMA_NAME_PREFIX-irdma-sub",
          "stackType": "IPV4_ONLY",
          "nicType": "IRDMA",
      }
    ],
,
    "scheduling":
    {
      "provisioningModel": "SPOT",
      "instanceTerminationAction": "TERMINATION_ACTION"
    }
  }
}

Ersetzen Sie Folgendes:

  • INSTANCE_TEMPLATE_NAME ist der Name der Instanzvorlage.
  • MACHINE_TYPE: der für die Instanz zu verwendende Maschinentyp. Geben Sie einen H4D-Maschinentyp an. Weitere Informationen finden Sie unter H4D-Maschinentypen.
  • IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.
  • IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.
  • REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Weitere Informationen zu Regionen finden Sie unter Regionen und Zonen.
  • DISK_SIZE: Die Größe des Bootlaufwerks in GiB.
  • GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze für die gVNIC-Schnittstellen verwendet haben.

    Wenn Sie das Standardnetzwerk verwenden, geben Sie nur ein einzelnes --network-interface-Feld an, wobei das Feld nic-type auf GVNIC festgelegt ist. Lassen Sie außerdem die Einstellungen network und subnetwork für diese Netzwerkschnittstelle weg.

  • EXTERNAL_IPV4_ADDRESS (optional): Eine statische externe IPv4-Adresse, die mit der gVNIC-Netzwerkschnittstelle verwendet werden soll. Sie müssen zuvor eine externe IPv4-Adresse reserviert haben.

    Verwenden Sie stattdessen das Flag --external-ipv6-address, um eine externe IPv6-Adresse für die GVNIC-Netzwerkschnittstelle anzugeben.

  • RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen des VPC-Netzwerks und des Subnetzes für die IRDMA-Netzwerkschnittstelle verwendet haben.

    Wenn Sie Cloud RDMA nicht mit Ihren H4D-Instanzen verwenden, lassen Sie das Feld --network-interface für die IRDMA-Schnittstelle weg.

  • TERMINATION_ACTION: Gibt an, ob Compute Engine die Spot-VMs bei einem Vorabzugriff beendet (STOP) oder löscht (DELETE).

Nachdem Sie die Instanzvorlage erstellt haben, können Sie sie aufrufen, um ihre ID und die Instanzeigenschaften zu sehen.

Eine MIG erstellen.

Nachdem Sie alle vorherigen Schritte ausgeführt haben, erstellen Sie eine MIG basierend auf Ihrem Szenario:

Szenario Methode zum Erstellen einer MIG und der darin enthaltenen VMs Beispiel
Sie haben mehrere oder parallele Jobs, die mit einer beliebigen Anzahl von VMs gestartet werden können. Erstellen Sie eine MIG und geben Sie mit der Zielgröße die Anzahl der VMs an, die Sie in der Gruppe haben möchten.

Weitere Informationen finden Sie unter MIG mit Zielgröße erstellen.

ML-Inferenzjobs
Sie haben einen Job, der auf eine genaue Anzahl von VMs verteilt werden muss. Erstellen Sie eine MIG ohne VMs und dann eine Anfrage zur Größenanpassung in der MIG. Mit der Anfrage zur Größenanpassung können Sie alle VMs auf einmal erhalten.

Weitere Informationen finden Sie unter MIG und Anfrage zur Größenanpassung erstellen.

Verteilte ML-Trainings- und ‑Abstimmungsjobs

MIG mit Zielgröße erstellen

Wenn Sie Ihren Job starten können, ohne alle VMs gleichzeitig zu erstellen, erstellen Sie eine MIG mit einer Zielgröße. Die Zielgröße bestimmt die Anzahl der VMs in der verwalteten Instanzgruppe. Die verwaltete Instanzgruppe beginnt mit dem Erstellen von VMs basierend auf der aktuellen Ressourcenverfügbarkeit. Wenn eine Ressource vorübergehend nicht verfügbar ist, versucht die verwaltete Instanzgruppe kontinuierlich, VMs zu erstellen, um die Zielgröße zu erreichen.

Wählen Sie eine der folgenden Optionen aus, um eine MIG mit einer Zielgröße zu erstellen:

gcloud

Verwenden Sie den Befehl instance-groups managed create, um eine MIG mit einer angegebenen Zielgröße zu erstellen.

Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.

So erstellen Sie eine zonale oder regionale MIG:

  • Verwenden Sie den folgenden Befehl, um eine zonale MIG zu erstellen:
    gcloud compute instance-groups managed create MIG_NAME \
      --template=INSTANCE_TEMPLATE_URL \
      --size=TARGET_SIZE \
      --workload-policy=WORKLOAD_POLICY_URL \
      --zone=ZONE
    
  • Verwenden Sie zum Erstellen einer regionalen MIG den folgenden Befehl:
    gcloud compute instance-groups managed create MIG_NAME \
        --template=INSTANCE_TEMPLATE_URL \
        --size=TARGET_SIZE \
        --workload-policy=WORKLOAD_POLICY_URL \
        --region=REGION
    
Ersetzen Sie Folgendes:
  • MIG_NAME: Name der MIG.
  • INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
    • Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
  • TARGET_SIZE: Die Anzahl der VMs, die Sie in der MIG haben möchten.
  • WORKLOAD_POLICY_URL (Optional): Die URL der Arbeitslastrichtlinie. Beispiel: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, können Sie das Flag --workload-policy entfernen.
  • ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie eine Zone innerhalb der Region der Richtlinie an.
  • REGION: die Region, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie dieselbe Region wie für die Richtlinie an. Bei einer regionalen MIG können Sie anstelle einer Region die Zonen in dieser Region mit dem --zones-Flag angeben.

REST

Wenn Sie eine MIG mit einer bestimmten Zielgröße erstellen möchten, senden Sie eine POST-Anfrage.

In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.

So erstellen Sie eine zonale oder regionale MIG:

  • Wenn Sie eine zonale MIG erstellen möchten, senden Sie eine POST-Anfrage an die Methode instanceGroupManagers.insert.
    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
    {
      "versions": [
        {
          "instanceTemplate": "INSTANCE_TEMPLATE_URL"
        }
      ],
      "name": "MIG_NAME",
      "instanceTemplate": "INSTANCE_TEMPLATE_URL",
      "targetSize": "TARGET_SIZE",
      "resourcePolicies": {
        "workloadPolicy": WORKLOAD_POLICY_URL
      }
    }
    
  • Um eine regionale MIG zu erstellen, senden Sie eine POST-Anfrage an die Methode regionInstanceGroupManagers.insert.
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "instanceTemplate": "INSTANCE_TEMPLATE_URL",
        "targetSize": "TARGET_SIZE",
        "resourcePolicies": {
          "workloadPolicy": WORKLOAD_POLICY_URL
        }
      }
    
Ersetzen Sie Folgendes:
  • PROJECT_ID: Projekt-ID.
  • ZONE: die Zone, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie eine Zone innerhalb der Region der Richtlinie an.
  • REGION: die Region, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie dieselbe Region wie für die Richtlinie an.
  • INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
    • Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
  • MIG_NAME: Name der MIG.
  • TARGET_SIZE: Die Anzahl der VMs, die Sie in der MIG haben möchten.
  • WORKLOAD_POLICY_URL (Optional): Die URL der Arbeitslastrichtlinie. Beispiel: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, können Sie das Feld resourcePolicies.workloadPolicy entfernen.

MIG und Anfrage zur Größenanpassung erstellen

Wenn Sie mehrere VMs gleichzeitig benötigen, um einen Job zu starten, erstellen Sie eine MIG und dann eine Anfrage zur Größenänderung in der MIG, wie in diesem Abschnitt beschrieben.

Wählen Sie eine der folgenden Optionen aus, um eine Anfrage zur Größenanpassung in einer MIG zu erstellen.

gcloud

Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.

Flex-Start

So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:

  • So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:

    1. Erstellen Sie mit dem Befehl instance-groups managed create eine zonale MIG, wie unten beschrieben.

      gcloud compute instance-groups managed create MIG_NAME \
          --template=INSTANCE_TEMPLATE_URL \
          --size=0 \
          --default-action-on-vm-failure=do-nothing \
          --zone=ZONE
      
    2. Erstellen Sie mit dem Befehl instance-groups managed resize-requests create eine Anfrage zur Größenanpassung in der zonalen MIG:

      gcloud compute instance-groups managed resize-requests create MIG_NAME \
          --resize-request=RESIZE_REQUEST_NAME \
          --resize-by=COUNT \
          --zone=ZONE
      
  • So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:

    1. Erstellen Sie mit dem Befehl instance-groups managed create eine regionale MIG.

      gcloud compute instance-groups managed create MIG_NAME \
          --template=INSTANCE_TEMPLATE_URL \
          --size=0 \
          --default-action-on-vm-failure=do-nothing \
          --zones=ZONE \
          --target-distribution-shape=any-single-zone \
          --instance-redistribution-type=none
        
    2. Erstellen Sie mit dem Betabefehl instance-groups managed resize-requests create eine Anfrage zur Größenanpassung in der regionalen MIG:

      gcloud beta compute instance-groups managed resize-requests create MIG_NAME \
          --resize-request=RESIZE_REQUEST_NAME \
          --resize-by=COUNT \
          --region=REGION
      

Reservierungsgebunden

Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.

So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:

  • So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:

    1. Erstellen Sie mit dem Befehl instance-groups managed create eine zonale MIG, wie unten beschrieben.

      gcloud compute instance-groups managed create MIG_NAME \
          --template=INSTANCE_TEMPLATE_URL \
          --size=0 \
          --workload-policy=WORKLOAD_POLICY_URL \
          --zone=ZONE
      
    2. Erstellen Sie mit dem Befehl instance-groups managed resize-requests create eine Anfrage zur Größenanpassung in der zonalen MIG:

      gcloud compute instance-groups managed resize-requests create MIG_NAME \
          --resize-request=RESIZE_REQUEST_NAME \
          --resize-by=COUNT \
          --zone=ZONE
      
  • So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:

    1. Erstellen Sie mit dem Befehl instance-groups managed create eine regionale MIG.

      gcloud compute instance-groups managed create MIG_NAME \
          --template=INSTANCE_TEMPLATE_URL \
          --size=0 \
          --workload-policy=WORKLOAD_POLICY_URL \
          --zones=ZONE \
          --target-distribution-shape=any-single-zone \
          --instance-redistribution-type=none
        
    2. Erstellen Sie mit dem Betabefehl instance-groups managed resize-requests create eine Anfrage zur Größenanpassung in der regionalen MIG:

      gcloud beta compute instance-groups managed resize-requests create MIG_NAME \
          --resize-request=RESIZE_REQUEST_NAME \
          --resize-by=COUNT \
          --region=REGION
      

Spot

Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.

So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:

  • So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:

    1. Erstellen Sie mit dem Befehl instance-groups managed create eine zonale MIG, wie unten beschrieben.

      gcloud compute instance-groups managed create MIG_NAME \
          --template=INSTANCE_TEMPLATE_URL \
          --size=0 \
          --workload-policy=WORKLOAD_POLICY_URL \
          --zone=ZONE
      
    2. Erstellen Sie mit dem Befehl instance-groups managed resize-requests create eine Anfrage zur Größenanpassung in der zonalen MIG:

      gcloud compute instance-groups managed resize-requests create MIG_NAME \
          --resize-request=RESIZE_REQUEST_NAME \
          --resize-by=COUNT \
          --zone=ZONE
      
  • So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:

    1. Erstellen Sie mit dem Befehl instance-groups managed create eine regionale MIG.

      gcloud compute instance-groups managed create MIG_NAME \
          --template=INSTANCE_TEMPLATE_URL \
          --size=0 \
          --workload-policy=WORKLOAD_POLICY_URL \
          --zones=ZONE \
          --target-distribution-shape=any-single-zone \
          --instance-redistribution-type=none
        
    2. Erstellen Sie mit dem Betabefehl instance-groups managed resize-requests create eine Anfrage zur Größenanpassung in der regionalen MIG:

      gcloud beta compute instance-groups managed resize-requests create MIG_NAME \
          --resize-request=RESIZE_REQUEST_NAME \
          --resize-by=COUNT \
          --region=REGION
      
Ersetzen Sie Folgendes:
  • MIG_NAME: Name der MIG.
  • INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
    • Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
  • WORKLOAD_POLICY_URL (Optional): Die URL der Arbeitslastrichtlinie. Beispiel: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, können Sie das Flag --workload-policy entfernen.
  • ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Auch für eine regionale MIG müssen Sie eine Zone angeben. Diese Zone muss die Zone sein, die das Profil für Ihr VPC-Netzwerk enthält, und eine Zone sein, in der der Maschinentyp verfügbar ist. Weitere Informationen finden Sie unter Einschränkungen.
  • RESIZE_REQUEST_NAME: der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.
  • COUNT: Die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.
  • REGION: die Region, in der sich die MIG befindet.

Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie mit dem Befehl beta instance-groups managed resize-requests create eine Liste der Namen der zu erstellenden VMs angeben. Ersetzen Sie im Befehl das Flag --resize-request durch das Flag --instances.

REST

Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.

Flex-Start

So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:

  • So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
    1. Erstellen Sie eine zonale MIG, indem Sie eine POST-Anfrage an die Methode instanceGroupManagers.insert stellen.
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "targetSize": 0,
        "instanceLifecyclePolicy": {
          "defaultActionOnFailure": "DO_NOTHING"
        }
      }
      
    2. Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine POST-Anfrage an die Methode instanceGroupManagerResizeRequests.insert senden:
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests
      {
        "name": "RESIZE_REQUEST_NAME",
        "resizeBy": COUNT
      }
      
  • So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
    1. So erstellen Sie eine regionale MIG und senden eine POST-Anfrage an die regionInstanceGroupManagers.insert-Methode:
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "targetSize": 0,
        "distributionPolicy": {
          "targetShape": "ANY_SINGLE_ZONE",
          "zones": [
            {
              "zone": "projects/PROJECT_ID/zones/ZONE"
            }
          ]
        },
        "updatePolicy": {
          "instanceRedistributionType": "NONE"
        },
        "instanceLifecyclePolicy": {
          "defaultActionOnFailure": "DO_NOTHING"
        }
      }
      
    2. Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine POST-Anfrage an die Methode beta.regionInstanceGroupManagerResizeRequests.insert senden:
      POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests
      {
        "name": "RESIZE_REQUEST_NAME",
        "resizeBy": COUNT
      }
      

Reservierungsgebunden

In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.

So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:

  • So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
    1. Erstellen Sie eine zonale MIG, indem Sie eine POST-Anfrage an die Methode instanceGroupManagers.insert stellen.
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "targetSize": 0,
        "resourcePolicies": {
          "workloadPolicy": WORKLOAD_POLICY_URL
        }
      }
      
    2. Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine POST-Anfrage an die Methode instanceGroupManagerResizeRequests.insert senden:
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests
      {
        "name": "RESIZE_REQUEST_NAME",
        "resizeBy": COUNT
      }
      
  • So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
    1. So erstellen Sie eine regionale MIG und senden eine POST-Anfrage an die regionInstanceGroupManagers.insert-Methode:
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "targetSize": 0,
        "distributionPolicy": {
          "targetShape": "ANY_SINGLE_ZONE",
          "zones": [
            {
              "zone": "projects/PROJECT_ID/zones/ZONE"
            }
          ]
        },
        "updatePolicy": {
          "instanceRedistributionType": "NONE"
        },
        "resourcePolicies": {
          "workloadPolicy": WORKLOAD_POLICY_URL
        }
      }
      
    2. Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine POST-Anfrage an die Methode beta.regionInstanceGroupManagerResizeRequests.insert senden:
      POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests
      {
        "name": "RESIZE_REQUEST_NAME",
        "resizeBy": COUNT
      }
      

Spot

In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.

So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:

  • So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
    1. Erstellen Sie eine zonale MIG, indem Sie eine POST-Anfrage an die Methode instanceGroupManagers.insert stellen.
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "targetSize": 0,
        "resourcePolicies": {
          "workloadPolicy": WORKLOAD_POLICY_URL
        }
      }
      
    2. Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine POST-Anfrage an die Methode instanceGroupManagerResizeRequests.insert senden:
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests
      {
        "name": "RESIZE_REQUEST_NAME",
        "resizeBy": COUNT
      }
      
  • So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
    1. So erstellen Sie eine regionale MIG und senden eine POST-Anfrage an die regionInstanceGroupManagers.insert-Methode:
      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers
      {
        "versions": [
          {
            "instanceTemplate": "INSTANCE_TEMPLATE_URL"
          }
        ],
        "name": "MIG_NAME",
        "targetSize": 0,
        "distributionPolicy": {
          "targetShape": "ANY_SINGLE_ZONE",
          "zones": [
            {
              "zone": "projects/PROJECT_ID/zones/ZONE"
            }
          ]
        },
        "updatePolicy": {
          "instanceRedistributionType": "NONE"
        },
        "resourcePolicies": {
          "workloadPolicy": WORKLOAD_POLICY_URL
        }
      }
      
    2. Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine POST-Anfrage an die Methode beta.regionInstanceGroupManagerResizeRequests.insert senden:
      POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests
      {
        "name": "RESIZE_REQUEST_NAME",
        "resizeBy": COUNT
      }
      
Ersetzen Sie Folgendes:
  • PROJECT_ID: Projekt-ID.
  • ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Auch für eine regionale MIG müssen Sie eine Zone angeben. Diese Zone muss die Zone sein, die das Profil für Ihr VPC-Netzwerk enthält, und eine Zone sein, in der der Maschinentyp verfügbar ist. Weitere Informationen finden Sie unter Einschränkungen.
  • REGION: Die Region, in der Sie die MIG erstellen möchten.
  • INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:
    • Für eine regionale Instanzvorlage: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Für eine globale Instanzvorlage: INSTANCE_TEMPLATE_ID
  • MIG_NAME: Name der MIG.
  • WORKLOAD_POLICY_URL (Optional): Die URL der Arbeitslastrichtlinie. Beispiel: projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, können Sie das Feld resourcePolicies.workloadPolicy entfernen.
  • RESIZE_REQUEST_NAME: der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.
  • COUNT: die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen

Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie eine Liste der Namen der zu erstellenden VMs angeben. Senden Sie dazu eine POST-Anfrage an die Methode beta.regionInstanceGroupManagerResizeRequests.insert für eine regionale MIG oder an die Methode beta.instanceGroupManagerResizeRequests.insert für eine zonale MIG. Ersetzen Sie im Anfragetext das Feld resizeBy durch das instanceNames-Feld.

Nächste Schritte