In diesem Dokument wird beschrieben, wie Sie eine verwaltete Instanzgruppe (MIG) erstellen, die A4- oder A3-Ultra-Maschinentypen verwendet. Weitere Informationen zu diesen beschleunigungsoptimierten Maschinentypen finden Sie unter A4 oder A3 Ultra.
Wenn Sie eine MIG erstellen, können Sie mehrere VMs als eine einzelne Entität verwalten. Jede VM in einer MIG basiert auf einer Instanzvorlage. Da MIGs die VMs in der Gruppe automatisch verwalten, bieten sie Hochverfügbarkeit und Skalierbarkeit. Weitere Informationen zu verwalteten Instanzgruppen finden Sie in der Compute Engine-Dokumentation unter Verwaltete Instanzgruppen.
Weitere Informationen zum Erstellen von VMs oder Clustern finden Sie auf der Seite VMs und Cluster erstellen – Übersicht.
Beschränkungen
Wenn Sie eine MIG mit A4- oder A3-Ultra-VMs erstellen, beachten Sie die Einschränkungen für den Maschinentyp und die MIG.
Einschränkungen für A4- oder A3 Ultra-VMs
Je nach Maschinenserie, die von den VMs in Ihrer MIG verwendet wird, gelten die folgenden Einschränkungen:
A4
- Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A4-Maschinentyp verwenden.
- Sie können einen A4-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
- Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
- Der A4-Maschinentyp ist nur auf der Emerald Rapids-CPU-Plattform verfügbar.
- Sie können den Maschinentyp einer Instanz nicht in einen A4-Maschinentyp ändern oder von einem A4-Maschinentyp weg ändern. Sie müssen eine neue Instanz mit diesem Maschinentyp erstellen.
- A4-Maschinentypen unterstützen keine einzelnen Mandanten.
- Sie können Windows-Betriebssysteme nicht auf einem A4-Maschinentyp ausführen.
- Bei A4-Instanzen werden die Zähler für physische Ports, die mit
_phyenden, nicht aktualisiert, wenn Sieethtool -Sverwenden, um das GPU-Netzwerk zu überwachen. Dies ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur für virtuelle Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung. - Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an A4-Maschinentypen anhängen.
A3 Ultra
- Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Ultra-Maschinentyp verwenden.
- Sie können einen A3-Ultra-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
- Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
- Der A3-Ultra-Maschinentyp ist nur auf der Emerald Rapids-CPU-Plattform verfügbar.
- Änderungen des Maschinentyps werden für den A3-Ultra-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
- Sie können Windows-Betriebssysteme nicht auf einem A3-Ultra-Maschinentyp ausführen.
- A3-Ultra-Maschinentypen unterstützen keine einzelnen Mandanten.
- Bei A3 Ultra-Instanzen werden die Zähler für physische Ports, die mit
_phyenden, nicht aktualisiert, wenn Sieethtool -Sverwenden, um das GPU-Netzwerk zu überwachen. Das ist das erwartete Verhalten für Instanzen, die die MRDMA-Architektur mit virtuellen Funktionen (VF) verwenden. Weitere Informationen finden Sie unter MRDMA-Funktionen und Tools zur Netzwerküberwachung.
Beschränkungen für die MIG
Wenn Sie eine MIG mit A4- oder A3 Ultra-VMs erstellen, gelten die folgenden Einschränkungen:
Wenn in der Instanzvorlage, die für die verwaltete Instanzgruppe verwendet werden soll, das Bereitstellungsmodell „Flex-Start“ angegeben ist, gelten die folgenden Einschränkungen:
Sie können der MIG nur VMs hinzufügen, indem Sie Anfragen zur Größenanpassung verwenden.
Sie können keine Arbeitslastrichtlinie auf die MIG anwenden.
Sie müssen die Reparaturen in der MIG deaktivieren.
Wenn Sie eine regionale MIG erstellen, können mit der MIG nur VMs in der Zone erstellt werden, die das Profil Ihres VPC-Netzwerks enthält.
Sie können die Instanzflexibilität in der MIG nicht konfigurieren.
Wenn Sie eine Arbeitslastrichtlinie auf eine verwaltete Instanzgruppe anwenden, können Sie die Richtlinie in der verwalteten Instanzgruppe nicht ändern, wenn die Gruppe VMs enthält. Wenn Sie die Richtlinie in einer MIG mit VMs ändern möchten, müssen Sie die MIG zuerst auf null skalieren.
Sie können keine Instanzvorlage verwenden, die eine Platzierungsrichtlinie angibt, um eine MIG zu erstellen, die eine Arbeitslastrichtlinie verwendet.
Beim Erstellen von Anfragen zur Größenänderung für MIGs gelten die folgenden Einschränkungen:
In einer regionalen MIG können Sie nur die
ANY_SINGLE_ZONEZielverteilungsform (Vorschau) verwenden. Andere Verteilungsformen werden nicht unterstützt.Sie können den Stand‑by-Pool-Modus der verwalteten Instanzgruppe nur auf
manual(Standardwert) festlegen.Sie können Autoscaling nicht festlegen.
Wenn die MIG akzeptierte Anfragen zur Größenanpassung enthält, können Sie Folgendes nicht tun:
Sie können keine zweite Instanzvorlage hinzufügen, um ein Canary Update in der MIG zu initiieren.
Sie können die Zielgröße der MIG nicht ändern.
Sie können die verwalteten Instanzen mit dem Status
CREATING, die von der MIG für eine Anfrage zur Größenanpassung erstellt werden, nicht löschen oder verwerfen. Wenn Sie diese verwalteten Instanzen löschen möchten, müssen Sie die Anfrage zur Größenanpassung abbrechen.
Hinweise
Führen Sie vor dem Erstellen einer MIG die folgenden Schritte aus, sofern Sie dies noch nicht getan haben:
- Nutzungsoption auswählen: Die von Ihnen gewählte Nutzungsoption bestimmt, wie Sie GPU-Ressourcen beziehen und nutzen.
Weitere Informationen finden Sie unter Nutzungsoption auswählen.
- Kapazität abrufen: Der Prozess zum Abrufen von Kapazität unterscheidet sich für jede Verbrauchsoption.
Informationen zum Erhalten von Kapazität für die von Ihnen gewählte Verbrauchsoption finden Sie unter Kapazitätsübersicht.
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie zum Erstellen einer MIG benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) für das Projekt zu gewähren.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen einer MIG erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind zum Erstellen einer MIG erforderlich:
-
So erstellen Sie eine MIG:
compute.instanceGroupManagers.createfür das Projekt
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Übersicht
Das Erstellen einer MIG mit dem Maschinentyp „A4 Ultra“ oder „A3 Ultra“ umfasst die folgenden Schritte:
- VPC-Netzwerke erstellen
- Optional: Arbeitslastrichtlinie erstellen
- Instanzvorlage erstellen
- Eine MIG erstellen
VPC-Netzwerke erstellen
Wenn Sie das Netzwerk für den Maschinentyp A4 oder A3 Ultra einrichten möchten, erstellen Sie drei VPC-Netzwerke für die folgenden Netzwerkschnittstellen:
- 2 reguläre VPC-Netzwerke für die gVNIC-Netzwerkschnittstellen (NIC). Sie werden für die Kommunikation zwischen Hosts verwendet.
- Für die CX-7-NICs ist ein VPC-Netzwerk mit dem RoCE-Netzwerkprofil erforderlich. Das RoCE-VPC-Netzwerk muss acht Subnetze haben, ein Subnetz für jede CX-7-NIC. Diese NICs verwenden RDMA over Converged Ethernet (RoCE) und bieten so die Kommunikation mit hoher Bandbreite und niedriger Latenz, die für die GPU-zu-GPU-Kommunikation unerlässlich ist.
Weitere Informationen zur NIC-Anordnung finden Sie unter Netzwerkbandbreite und NIC-Anordnung prüfen.
Sie können die Netzwerke entweder manuell anhand der Anleitungen oder automatisch mit dem bereitgestellten Skript erstellen.
Anleitungen
So erstellen Sie die Netzwerke:
- Informationen zum Erstellen der regulären VPC-Netzwerke für die gVNICs finden Sie unter VPC-Netzwerke erstellen und verwalten.
- Informationen zum Erstellen des RoCE-VPC-Netzwerks finden Sie unter VPC-Netzwerk für RDMA-NICs erstellen.
Für diese VPC-Netzwerke empfehlen wir, die maximale Übertragungseinheit (Maximum Transmission Unit, MTU) auf einen höheren Wert festzulegen.
Für den Maschinentyp A4 oder A3 Ultra wird eine MTU von 8896 Byte empfohlen.
Die empfohlenen MTU-Einstellungen für andere GPU-Maschinentypen finden Sie unter MTU-Einstellungen für GPU-Maschinentypen.
Skript
So erstellen Sie die Netzwerke:
Für diese VPC-Netzwerke empfehlen wir, die maximale Übertragungseinheit (Maximum Transmission Unit, MTU) auf einen höheren Wert festzulegen.
Für den Maschinentyp A4 oder A3 Ultra wird eine MTU von 8896 Byte empfohlen.
Die empfohlenen MTU-Einstellungen für andere GPU-Maschinentypen finden Sie unter MTU-Einstellungen für GPU-Maschinentypen.
Verwenden Sie das folgende Skript, um VPC-Netzwerke für die gVNICs und CX-7-NICs zu erstellen.
#!/bin/bash # Create regular VPC networks and subnets for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs doneErsetzen Sie Folgendes:
GVNIC_NAME_PREFIX: Das benutzerdefinierte Namenspräfix, das für die regulären VPC-Netzwerke und -Subnetze für die gVNICs verwendet werden soll.RDMA_NAME_PREFIX: Das benutzerdefinierte Namenspräfix, das für das RoCE-VPC-Netzwerk und die Subnetze für die CX-7-NICs verwendet werden soll.ZONE: Geben Sie eine Zone an, in der der Maschinentyp, den Sie verwenden möchten, verfügbar ist, z. B.us-central1-a. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.REGION: Die Region, in der Sie die Subnetze erstellen möchten. Diese Region muss der angegebenen Zone entsprechen. Wenn Ihre Zone beispielsweiseus-central1-aist, lautet Ihre Regionus-central1.IP_RANGE: Der IP-Bereich, der für die SSH-Firewallregeln verwendet werden soll.
- Optional: Prüfen Sie die Netzwerkeinstellungen in der Google Cloud -Konsole, um zu bestätigen, dass die VPC-Netzwerkressourcen erfolgreich erstellt wurden:
- Rufen Sie in der Google Cloud Console die Seite VPC-Netzwerke auf.
- Suchen Sie in der Liste nach den Netzwerken, die Sie im vorherigen Schritt erstellt haben.
- Klicken Sie auf den Namen des Netzwerks, um die Subnetze, Firewallregeln und andere Netzwerkeinstellungen aufzurufen.
Optional: Arbeitslastrichtlinie erstellen
Wenn Sie die Aufnahmeoption „Flexibler Start“ verwenden, überspringen Sie diesen Abschnitt und fahren Sie mit dem Erstellen einer Instanzvorlage fort. Aufgrund von Einschränkungen werden Arbeitslastrichtlinien für das Bereitstellungsmodell „Flex-Start“ nicht unterstützt.Sie können die VM-Platzierung angeben, indem Sie eine Arbeitslastrichtlinie erstellen. Wenn Sie bereits eine Arbeitslastrichtlinie haben, können Sie sie wiederverwenden. Wenn Sie eine Arbeitslastrichtlinie auf Ihre MIG anwenden, versucht Compute Engine, VMs zu erstellen, die so nah wie möglich beieinander liegen. Wenn Ihre Anwendung latenzempfindlich ist und Sie möchten, dass die VMs näher beieinander liegen (maximale Kompaktheit), geben Sie beim Erstellen einer Arbeitslastrichtlinie das Feld maxTopologyDistance an.
Sie können eine Arbeitslastrichtlinie nach dem Erstellen nicht mehr aktualisieren. Wenn Sie Änderungen an einer Arbeitslastrichtlinie vornehmen möchten, müssen Sie eine neue erstellen.
Wählen Sie eine der folgenden Optionen aus, um eine Arbeitslastrichtlinie zu erstellen:
gcloud
Verwenden Sie zum Erstellen einer Workload-Richtlinie den
Befehl gcloud compute resource-policies create workload-policy.
-
Wenn Sie eine Best-Effort-Platzierung von VMs wünschen, geben Sie im Befehl nur das Flag
--type=high-throughputan:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGION -
Geben Sie für die strikte Colocation von VMs das Flag
--max-topology-distanceim Befehl an:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --max-topology-distance=TOPOLOGY_DISTANCE \ --region=REGION
Ersetzen Sie Folgendes:
WORKLOAD_POLICY_NAME: Der Name der Arbeitslastrichtlinie.TOPOLOGY_DISTANCE: Der maximale Topologieabstand. Geben Sie einen der folgenden Werte an:- VMs im selben Cluster platzieren:
CLUSTER - So platzieren Sie VMs im selben Block:
BLOCK - So platzieren Sie VMs im selben Unterblock:
SUBBLOCK
Hinweis: Ein kürzerer maximaler Abstand kann die Wahrscheinlichkeit der VM-Verfügbarkeit verringern.- VMs im selben Cluster platzieren:
REGION: Die Region, in der Sie die Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.
REST
Senden Sie zum Erstellen einer Arbeitslastrichtlinie eine POST-Anfrage an die Methode resourcePolicies.insert.
-
Wenn Sie eine Best-Effort-Platzierung von VMs wünschen, geben Sie in der Anfrage nur das Feld
typean:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT" } } -
Wenn Sie VMs strikt nebeneinander platzieren möchten, geben Sie das Feld
maxTopologyDistancein der Anfrage so an:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT", "maxTopologyDistance": "TOPOLOGY_DISTANCE" } }
Ersetzen Sie Folgendes:
PROJECT_ID: Ihre Projekt-ID.REGION: Die Region, in der Sie die Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.WORKLOAD_POLICY_NAME: Der Name der Arbeitslastrichtlinie.TOPOLOGY_DISTANCE: Der maximale Topologieabstand. Geben Sie einen der folgenden Werte an:- So platzieren Sie VMs im selben Block:
BLOCK - VMs im selben Cluster platzieren:
CLUSTER
Hinweis: Ein kürzerer maximaler Abstand kann die Wahrscheinlichkeit der VM-Verfügbarkeit verringern.- So platzieren Sie VMs im selben Block:
Instanzvorlage erstellen
Geben Sie die VM-Attribute für eine MIG an, indem Sie eine Instanzvorlage erstellen.
Wählen Sie eine der folgenden Optionen aus, um eine Instanzvorlage zu erstellen.
Mit den folgenden Befehlen wird auch der Zugriffsbereich für Ihre Instanzen festgelegt. Um die Berechtigungsverwaltung zu vereinfachen, empfiehlt Google, den Zugriffsbereich für eine Instanz aufcloud-platform-Zugriff festzulegen und dann mit IAM-Rollen zu definieren, auf welche Dienste die Instanz zugreifen kann. Weitere Informationen finden Sie unter Best Practices für Bereiche.
gcloud
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--reservation-affinity=none \
--instance-termination-action=DELETE \
--max-run-duration=RUN_DURATION \
--maintenance-policy=TERMINATE \
--provisioning-model=FLEX_START
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.RUN_DURATION: die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Sie müssen den Wert als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt vond,h,mbzw.sformatieren. Geben Sie beispielsweise30mfür 30 Minuten oder1d2h3m4sfür einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.
Reservierungsgebunden
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--reservation-affinity=specific \
--reservation=RESERVATION \
--provisioning-model=RESERVATION_BOUND \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE \
--restart-on-failure
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.-
RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (
maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie Instanzen auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--provisioning-model=SPOT \
--instance-termination-action=TERMINATION_ACTION \
--maintenance-policy=TERMINATE \
--no-restart-on-failure
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.TERMINATION_ACTION: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP(Standard) oderDELETE.
REST
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"reservationAffinity": {
"consumeReservationType": "NO_RESERVATION"
},
"scheduling": {
"instanceTerminationAction": "DELETE",
"maxRunDuration": {
"seconds": RUN_DURATION
},
"onHostMaintenance": "TERMINATE",
"provisioningModel": "FLEX_START"
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.RUN_DURATIONist die Dauer in Sekunden, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss zwischen600, d. h. 600 Sekunden (10 Minuten), und604800, also 604.800 Sekunden (7 Tage) liegen.
Reservierungsgebunden
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"reservationAffinity":{
"consumeReservationType":"SPECIFIC_RESERVATION",
"key":"compute.googleapis.com/reservation-name",
"values":[
"RESERVATION"
]
},
"scheduling":{
"provisioningModel":"RESERVATION_BOUND",
"instanceTerminationAction":"DELETE",
"onHostMaintenance": "TERMINATE",
"automaticRestart":true
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.-
RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (
maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie Instanzen auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"scheduling":
{
"provisioningModel": "SPOT",
"instanceTerminationAction": "TERMINATION_ACTION",
"onHostMaintenance": "TERMINATE",
"automaticRestart": false
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.TERMINATION_ACTION: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP(Standard) oderDELETE.
Nachdem Sie die Instanzvorlage erstellt haben, können Sie sie aufrufen, um ihre ID und ihre Instanzeigenschaften zu sehen.
Eine MIG erstellen.
Nachdem Sie alle vorherigen Schritte ausgeführt haben, erstellen Sie eine MIG basierend auf Ihrem Szenario:
| Szenario | Methode zum Erstellen einer MIG und der darin enthaltenen VMs | Beispiel |
|---|---|---|
| Sie haben mehrere oder parallele Jobs, die mit einer beliebigen Anzahl von VMs gestartet werden können. | Erstellen Sie eine MIG und geben Sie mit der Zielgröße die Anzahl der VMs an, die Sie in der Gruppe haben möchten. Weitere Informationen finden Sie unter MIG mit Zielgröße erstellen. |
ML-Inferenzjobs |
| Sie haben einen Job, der auf eine genaue Anzahl von VMs verteilt werden muss. | Erstellen Sie eine MIG ohne VMs und dann eine Anfrage zur Größenanpassung in der MIG.
Mit der Anfrage zur Größenanpassung können Sie alle VMs auf einmal erhalten. Weitere Informationen finden Sie unter MIG und Anfrage zur Größenanpassung erstellen. |
Verteilte ML-Trainings- und ‑Abstimmungsjobs |
MIG mit Zielgröße erstellen
Wenn Sie Ihren Job starten können, ohne alle VMs gleichzeitig zu erstellen, erstellen Sie eine MIG mit einer Zielgröße. Die Zielgröße bestimmt die Anzahl der VMs in der verwalteten Instanzgruppe. Die verwaltete Instanzgruppe beginnt mit dem Erstellen von VMs basierend auf der aktuellen Ressourcenverfügbarkeit. Wenn eine Ressource vorübergehend nicht verfügbar ist, versucht die verwaltete Instanzgruppe kontinuierlich, VMs zu erstellen, um die Zielgröße zu erreichen.
Wählen Sie eine der folgenden Optionen aus, um eine verwaltete Instanzgruppe mit einer Zielgröße zu erstellen:
gcloud
Verwenden Sie den Befehl instance-groups managed
create, um eine MIG mit einer angegebenen Zielgröße zu erstellen.
Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.
So erstellen Sie eine zonale oder regionale MIG:
- Verwenden Sie den folgenden Befehl, um eine zonale MIG zu erstellen:
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE
- Verwenden Sie den folgenden Befehl, um eine regionale MIG zu erstellen:
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --region=REGION
MIG_NAME: Name der MIG.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
TARGET_SIZE: Die Anzahl der VMs, die Sie in der MIG haben möchten.WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, können Sie das Flag--workload-policyentfernen.ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie eine Zone innerhalb der Region der Richtlinie an.REGION: die Region, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie dieselbe Region wie für die Richtlinie an. Bei einer regionalen MIG können Sie anstelle einer Region die Zonen in dieser Region mit dem--zones-Flag angeben.
REST
Wenn Sie eine MIG mit einer bestimmten Zielgröße erstellen möchten, senden Sie eine POST-Anfrage.
In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.
So erstellen Sie eine zonale oder regionale MIG:
- Wenn Sie eine zonale MIG erstellen möchten, senden Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Um eine regionale MIG zu erstellen, senden Sie eine
POST-Anfrage an die MethoderegionInstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } }
PROJECT_ID: Projekt-ID.ZONE: die Zone, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie eine Zone innerhalb der Region der Richtlinie an.REGION: die Region, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie dieselbe Region wie für die Richtlinie an.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
MIG_NAME: Name der MIG.TARGET_SIZE: Die Anzahl der VMs, die Sie in der MIG haben möchten.WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policyWenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das FeldresourcePolicies.workloadPolicy.
MIG und Anfrage zur Größenanpassung erstellen
Wenn Sie mehrere VMs gleichzeitig benötigen, um einen Job zu starten, erstellen Sie eine MIG und dann eine Anfrage zur Größenänderung in der MIG, wie in diesem Abschnitt beschrieben.Wählen Sie eine der folgenden Optionen aus, um eine Anfrage zur Größenanpassung in einer MIG zu erstellen.
gcloud
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
-
So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine zonale MIG, wie unten beschrieben.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zone=ZONE -
Erstellen Sie mit dem Befehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der zonalen MIG:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine regionale MIG.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Erstellen Sie mit dem Betabefehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der regionalen MIG:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Reservierungsgebunden
Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
-
So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine zonale MIG, wie unten beschrieben.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Erstellen Sie mit dem Befehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der zonalen MIG:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine regionale MIG.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Erstellen Sie mit dem Betabefehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der regionalen MIG:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Spot
Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
-
So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine zonale MIG, wie unten beschrieben.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Erstellen Sie mit dem Befehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der zonalen MIG:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine regionale MIG.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Erstellen Sie mit dem Betabefehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der regionalen MIG:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
MIG_NAME: Name der MIG.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policyWenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag--workload-policy.ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Auch für eine regionale MIG müssen Sie eine Zone angeben. Diese Zone muss die Zone sein, die das Profil für Ihr VPC-Netzwerk enthält, und eine Zone sein, in der der Maschinentyp verfügbar ist. Weitere Informationen finden Sie unter Einschränkungen.RESIZE_REQUEST_NAME: der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT: Die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.REGION: die Region, in der sich die MIG befindet.
Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie mit dem Befehl beta instance-groups managed resize-requests create eine Liste der Namen der zu erstellenden VMs angeben.
Ersetzen Sie im Befehl das Flag --resize-request durch das Flag --instances.
REST
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
- So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
- Erstellen Sie eine zonale MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insertstellen.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Erstellen Sie eine zonale MIG, indem Sie eine
- So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
- So erstellen Sie eine regionale MIG und senden eine
POST-Anfrage an dieregionInstanceGroupManagers.insert-Methode:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine
POST-Anfrage an die Methodebeta.regionInstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- So erstellen Sie eine regionale MIG und senden eine
Reservierungsgebunden
In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
- So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
- Erstellen Sie eine zonale MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insertstellen.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Erstellen Sie eine zonale MIG, indem Sie eine
- So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
- So erstellen Sie eine regionale MIG und senden eine
POST-Anfrage an dieregionInstanceGroupManagers.insert-Methode:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine
POST-Anfrage an die Methodebeta.regionInstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- So erstellen Sie eine regionale MIG und senden eine
Spot
In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
- So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
- Erstellen Sie eine zonale MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insertstellen.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Erstellen Sie eine zonale MIG, indem Sie eine
- So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
- So erstellen Sie eine regionale MIG und senden eine
POST-Anfrage an dieregionInstanceGroupManagers.insert-Methode:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine
POST-Anfrage an die Methodebeta.regionInstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- So erstellen Sie eine regionale MIG und senden eine
PROJECT_ID: Projekt-ID.ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Auch für eine regionale MIG müssen Sie eine Zone angeben. Diese Zone muss die Zone sein, die das Profil für Ihr VPC-Netzwerk enthält, und eine Zone sein, in der der Maschinentyp verfügbar ist. Weitere Informationen finden Sie unter Einschränkungen.REGION: Die Region, in der Sie die MIG erstellen möchten.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
MIG_NAME: Name der MIG.WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policyWenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das FeldresourcePolicies.workloadPolicy.RESIZE_REQUEST_NAME: der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT: die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen
Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie eine Liste der Namen der zu erstellenden VMs angeben. Senden Sie dazu eine POST-Anfrage an die Methode beta.regionInstanceGroupManagerResizeRequests.insert für eine regionale MIG oder an die Methode beta.instanceGroupManagerResizeRequests.insert für eine zonale MIG. Ersetzen Sie im Anfragetext das Feld resizeBy durch das instanceNames-Feld.
Nächste Schritte
- Reservierungsnutzung prüfen
- Topologie einer Compute-Instanz ansehen
- VMs überwachen
- Fehlerhaften Host melden
- Anfragen zur Größenanpassung aufrufen, abbrechen oder löschen
- Fehlerbehebung bei der Nutzung von Reservierungen