In diesem Dokument wird beschrieben, wie Sie eine verwaltete Instanzgruppe (MIG) erstellen, die einen beschleunigungsoptimierten Maschinentyp vom Typ „A3 High“ oder „A3 Mega“ verwendet. Weitere Informationen zu den Maschinentypen finden Sie in der Compute Engine-Dokumentation unter A3 High und A3 Mega.
Wenn Sie eine MIG erstellen, können Sie mehrere VMs als eine einzelne Entität verwalten. Jede VM in einer MIG basiert auf einer Instanzvorlage. Da MIGs die VMs in der Gruppe automatisch verwalten, bieten sie Hochverfügbarkeit und Skalierbarkeit. Weitere Informationen zu verwalteten Instanzgruppen finden Sie in der Compute Engine-Dokumentation unter Verwaltete Instanzgruppen.
Informationen zu den Optionen zum Erstellen von VMs und Clustern finden Sie auf der Seite VMs und Cluster erstellen – Übersicht.
Beschränkungen
Je nach Maschinenserie, die von den VMs in Ihrer MIG verwendet wird, gelten die folgenden Einschränkungen:
A3 Mega
- Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-Mega-Maschinentyp verwenden.
- Sie können einen A3-Mega-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
- Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-Mega-Maschinentyp verwendet.
- Der Maschinentyp „A3 Mega“ ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
- Änderungen des Maschinentyps werden für den A3 Mega-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
- Sie können Windows-Betriebssysteme nicht auf einem A3 Mega-Maschinentyp ausführen.
A3 High
- Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die einen A3-High-Maschinentyp verwenden.
- Sie können einen A3 High-Maschinentyp nur in bestimmten Regionen und Zonen verwenden.
- Sie können keinen regionalen nichtflüchtigen Speicher auf einer Instanz verwenden, die einen A3-High-Maschinentyp verwendet.
- Der Maschinentyp „A3 High“ ist nur auf der Sapphire Rapids-CPU-Plattform verfügbar.
- Änderungen des Maschinentyps werden für den A3-High-Maschinentyp nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
- Sie können Windows-Betriebssysteme nicht auf einem A3 High-Maschinentyp ausführen.
- Für die Maschinentypen
a3-highgpu-1g,a3-highgpu-2gunda3-highgpu-4gmüssen Sie Instanzen mit Spot-VMs oder Flex-Start-VMs erstellen. Eine ausführliche Anleitung zu diesen Optionen finden Sie hier:- Wenn Sie Spot-VMs erstellen möchten, legen Sie das Bereitstellungsmodell auf
SPOTfest, wenn Sie eine beschleunigungsoptimierte VM erstellen. - Sie haben folgende Möglichkeiten, Flex-Start-VMs zu erstellen:
- Erstellen Sie eine eigenständige VM und legen Sie das Bereitstellungsmodell auf
FLEX_STARTfest, wenn Sie eine beschleunigungsoptimierte VM erstellen. - Erstellen Sie eine Anfrage zur Größenänderung in einer verwalteten Instanzgruppe (MIG). Eine Anleitung finden Sie unter MIG mit GPU-VMs erstellen.
- Erstellen Sie eine eigenständige VM und legen Sie das Bereitstellungsmodell auf
- Wenn Sie Spot-VMs erstellen möchten, legen Sie das Bereitstellungsmodell auf
- Sie können eine Confidential VM mit einem
a3-highgpu-1g-Maschinentyp nur in begrenzten Regionen und Zonen verwenden. Außerdem gelten alle Einschränkungen für Confidential VMs, die auf dem A3 High-Maschinentyp ausgeführt werden.
Hinweise
Führen Sie vor dem Erstellen einer MIG die folgenden Schritte aus, sofern Sie dies noch nicht getan haben:
- Nutzungsoption auswählen: Die von Ihnen gewählte Nutzungsoption bestimmt, wie Sie GPU-Ressourcen beziehen und nutzen.
Weitere Informationen finden Sie unter Nutzungsoption auswählen.
- Kapazität abrufen: Der Prozess zum Abrufen von Kapazität unterscheidet sich für jede Verbrauchsoption.
Informationen zum Erhalten von Kapazität für die von Ihnen gewählte Verbrauchsoption finden Sie unter Kapazitätsübersicht.
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie zum Erstellen einer MIG benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) für das Projekt zu gewähren.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen einer MIG erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind zum Erstellen einer MIG erforderlich:
-
So erstellen Sie eine MIG:
compute.instanceGroupManagers.createfür das Projekt
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Übersicht
Das Erstellen einer MIG mit dem Maschinentyp „A3 Mega“ oder „A3 High“ (8 GPUs) umfasst die folgenden Schritte:
- VPC-Netzwerke erstellen
- Optional: Arbeitslastrichtlinie erstellen
- Instanzvorlage erstellen
- Eine MIG erstellen
VPC-Netzwerke erstellen
Damit Ihre GPU-VMs effizient kommunizieren können, müssen Sie ein Verwaltungsnetzwerk und ein oder mehrere Datennetzwerke erstellen. Das Verwaltungsnetzwerk wird für den externen Zugriff, z. B. SSH, und für die meisten allgemeinen Netzwerkkommunikationen verwendet. Die Datennetzwerke werden für die leistungsstarke Kommunikation zwischen den GPUs auf verschiedenen VMs verwendet, z. B. für RDMA-Traffic (Remote Direct Memory Access).
Für diese VPC-Netzwerke empfehlen wir, die maximale Übertragungseinheit (Maximum Transmission Unit, MTU) auf einen höheren Wert festzulegen. Höhere MTU-Werte steigern die Paketgröße und reduzieren den Paketheader-Overhead, wodurch der Nutzlastdatendurchsatz erhöht wird. Weitere Informationen zum Erstellen von VPC-Netzwerken finden Sie unter MTU-Netzwerk im Jumbo Frame erstellen und prüfen.
Verwaltungsnetzwerk, Subnetz und Firewallregel erstellen
Führen Sie die folgenden Schritte aus, um das Verwaltungsnetzwerk einzurichten:
Erstellen Sie das Verwaltungsnetzwerk mit dem Befehl
networks create:gcloud compute networks create NETWORK_NAME_PREFIX-mgmt-net \ --project=PROJECT_ID \ --subnet-mode=custom \ --mtu=8244Erstellen Sie das Verwaltungssubnetz mit dem Befehl
networks subnets create:gcloud compute networks subnets create NETWORK_NAME_PREFIX-mgmt-sub \ --project=PROJECT_ID \ --network=NETWORK_NAME_PREFIX-mgmt-net \ --region=REGION \ --range=192.168.0.0/24Erstellen Sie Firewallregeln mit dem Befehl
firewall-rules create.Erstellen Sie eine Firewallregel für das Verwaltungsnetzwerk.
gcloud compute firewall-rules create NETWORK_NAME_PREFIX-mgmt-internal \ --project=PROJECT_ID \ --network=NETWORK_NAME_PREFIX-mgmt-net \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=192.168.0.0/16Erstellen Sie die Firewallregel
tcp:22, um einzuschränken, welche Quell-IP-Adressen eine SSH-Verbindung zu Ihrer VM herstellen können.gcloud compute firewall-rules create NETWORK_NAME_PREFIX-mgmt-external-ssh \ --project=PROJECT_ID \ --network=NETWORK_NAME_PREFIX-mgmt-net \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=SSH_SOURCE_IP_RANGEErstellen Sie die Firewallregel
icmp, mit der Sie nach Problemen mit der Datenübertragung im Netzwerk suchen können.gcloud compute firewall-rules create NETWORK_NAME_PREFIX-mgmt-external-ping \ --project=PROJECT_ID \ --network=NETWORK_NAME_PREFIX-mgmt-net \ --action=ALLOW \ --rules=icmp \ --source-ranges=0.0.0.0/0
Ersetzen Sie Folgendes:
NETWORK_NAME_PREFIX: Das Namenspräfix, das für die VPC-Netzwerke und -Subnetze verwendet werden soll.PROJECT_ID: Ihre Projekt-ID.REGION: Die Region, in der Sie die Netzwerke erstellen möchten.SSH_SOURCE_IP_RANGE: IP-Bereich im CIDR-Format. Hier wird angegeben, welche Quell-IP-Adressen über SSH eine Verbindung zu Ihrer VM herstellen können.
Datennetzwerke, Subnetze und Firewallregeln erstellen
Die Anzahl der Datennetzwerke hängt vom Typ der GPU-Maschine ab, die Sie erstellen.A3 Mega
Für A3 Mega sind acht Datennetzwerke erforderlich. Verwenden Sie den folgenden Befehl, um acht Datennetzwerke jeweils mit Subnetzen und Firewallregeln zu erstellen.
for N in $(seq 1 8); do
gcloud compute networks create NETWORK_NAME_PREFIX-data-net-$N \
--project=PROJECT_ID \
--subnet-mode=custom \
--mtu=8244
gcloud compute networks subnets create NETWORK_NAME_PREFIX-data-sub-$N \
--project=PROJECT_ID \
--network=NETWORK_NAME_PREFIX-data-net-$N \
--region=REGION \
--range=192.168.$N.0/24
gcloud compute firewall-rules create NETWORK_NAME_PREFIX-data-internal-$N \
--project=PROJECT_ID \
--network=NETWORK_NAME_PREFIX-data-net-$N \
--action=ALLOW \
--rules=tcp:0-65535,udp:0-65535,icmp \
--source-ranges=192.168.0.0/16
done
A3 High
Für A3 High sind vier Datennetzwerke erforderlich. Verwenden Sie den folgenden Befehl, um vier Datennetzwerke jeweils mit Subnetzen und Firewallregeln zu erstellen.
for N in $(seq 1 4); do
gcloud compute networks create NETWORK_NAME_PREFIX-data-net-$N \
--project=PROJECT_ID \
--subnet-mode=custom \
--mtu=8244
gcloud compute networks subnets create NETWORK_NAME_PREFIX-data-sub-$N \
--project=PROJECT_ID \
--network=NETWORK_NAME_PREFIX-data-net-$N \
--region=REGION \
--range=192.168.$N.0/24
gcloud compute firewall-rules create NETWORK_NAME_PREFIX-data-internal-$N \
--project=PROJECT_ID \
--network=NETWORK_NAME_PREFIX-data-net-$N \
--action=ALLOW \
--rules=tcp:0-65535,udp:0-65535,icmp \
--source-ranges=192.168.0.0/16
done
Optional: Arbeitslastrichtlinie erstellen
Wenn Sie die Aufnahmeoption „Flexibler Start“ verwenden, überspringen Sie diesen Abschnitt und fahren Sie mit dem Erstellen einer Instanzvorlage fort. Aufgrund von Einschränkungen werden Arbeitslastrichtlinien für das Bereitstellungsmodell „Flex-Start“ nicht unterstützt.Sie können die VM-Platzierung angeben, indem Sie eine Arbeitslastrichtlinie erstellen. Wenn Sie bereits eine Arbeitslastrichtlinie haben, können Sie sie wiederverwenden. Wenn Sie eine Arbeitslastrichtlinie auf Ihre MIG anwenden, versucht Compute Engine, VMs zu erstellen, die so nah wie möglich beieinander liegen. Wenn Ihre Anwendung latenzempfindlich ist und Sie möchten, dass die VMs näher beieinander liegen (maximale Kompaktheit), geben Sie beim Erstellen einer Arbeitslastrichtlinie das Feld maxTopologyDistance an.
Sie können eine Arbeitslastrichtlinie nach dem Erstellen nicht mehr aktualisieren. Wenn Sie Änderungen an einer Arbeitslastrichtlinie vornehmen möchten, müssen Sie eine neue erstellen.
Wählen Sie eine der folgenden Optionen aus, um eine Arbeitslastrichtlinie zu erstellen:
gcloud
Verwenden Sie zum Erstellen einer Workload-Richtlinie den
Befehl gcloud compute resource-policies create workload-policy.
-
Wenn Sie eine Best-Effort-Platzierung von VMs wünschen, geben Sie im Befehl nur das Flag
--type=high-throughputan:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGION -
Geben Sie für die strikte Colocation von VMs das Flag
--max-topology-distanceim Befehl an:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --max-topology-distance=TOPOLOGY_DISTANCE \ --region=REGION
Ersetzen Sie Folgendes:
WORKLOAD_POLICY_NAME: Der Name der Arbeitslastrichtlinie.TOPOLOGY_DISTANCE: Der maximale Topologieabstand. Geben Sie einen der folgenden Werte an:- VMs im selben Cluster platzieren:
CLUSTER - So platzieren Sie VMs im selben Block:
BLOCK - So platzieren Sie VMs im selben Unterblock:
SUBBLOCK
Hinweis: Ein kürzerer maximaler Abstand kann die Wahrscheinlichkeit der VM-Verfügbarkeit verringern.- VMs im selben Cluster platzieren:
REGION: Die Region, in der Sie die Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.
REST
Senden Sie zum Erstellen einer Arbeitslastrichtlinie eine POST-Anfrage an die Methode resourcePolicies.insert.
-
Wenn Sie eine Best-Effort-Platzierung von VMs wünschen, geben Sie in der Anfrage nur das Feld
typean:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT" } } -
Wenn Sie VMs strikt nebeneinander platzieren möchten, geben Sie das Feld
maxTopologyDistancein der Anfrage so an:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT", "maxTopologyDistance": "TOPOLOGY_DISTANCE" } }
Ersetzen Sie Folgendes:
PROJECT_ID: Ihre Projekt-ID.REGION: Die Region, in der Sie die Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.WORKLOAD_POLICY_NAME: Der Name der Arbeitslastrichtlinie.TOPOLOGY_DISTANCE: Der maximale Topologieabstand. Geben Sie einen der folgenden Werte an:- So platzieren Sie VMs im selben Block:
BLOCK - VMs im selben Cluster platzieren:
CLUSTER
Hinweis: Ein kürzerer maximaler Abstand kann die Wahrscheinlichkeit der VM-Verfügbarkeit verringern.- So platzieren Sie VMs im selben Block:
Instanzvorlage erstellen
Geben Sie die VM-Attribute für eine MIG an, indem Sie eine Instanzvorlage erstellen.
Wählen Sie eine der folgenden Optionen aus, um eine Instanzvorlage zu erstellen.
Mit den folgenden Befehlen wird auch der Zugriffsbereich für Ihre Instanzen festgelegt. Um die Berechtigungsverwaltung zu vereinfachen, empfiehlt Google, den Zugriffsbereich für eine Instanz aufcloud-platform-Zugriff festzulegen und dann mit IAM-Rollen zu definieren, auf welche Dienste die Instanz zugreifen kann. Weitere Informationen finden Sie unter Best Practices für Bereiche.
A3 Mega
Wenn Sie eine Instanzvorlage für A3 Mega-VMs erstellen möchten, müssen Sie acht zusätzliche Netzwerkschnittstellen für GPUDirect-TCPXO-Traffic angeben. Falls noch nicht geschehen, müssen Sie acht VPC-Netzwerke erstellen, wie unter VPC-Netzwerke erstellen beschrieben.
gcloud
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-5,subnet=GVNIC_NAME_PREFIX-sub-5,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-6,subnet=GVNIC_NAME_PREFIX-sub-6,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-7,subnet=GVNIC_NAME_PREFIX-sub-7,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-8,subnet=GVNIC_NAME_PREFIX-sub-8,no-address \
--reservation-affinity=none \
--instance-termination-action=DELETE \
--max-run-duration=RUN_DURATION \
--maintenance-policy=TERMINATE \
--provisioning-model=FLEX_START
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.RUN_DURATION: die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Sie müssen den Wert als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt vond,h,mbzw.sformatieren. Geben Sie beispielsweise30mfür 30 Minuten oder1d2h3m4sfür einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.
Reservierungsgebunden
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-5,subnet=GVNIC_NAME_PREFIX-sub-5,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-6,subnet=GVNIC_NAME_PREFIX-sub-6,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-7,subnet=GVNIC_NAME_PREFIX-sub-7,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-8,subnet=GVNIC_NAME_PREFIX-sub-8,no-address \
--reservation-affinity=specific \
--reservation=RESERVATION \
--provisioning-model=RESERVATION_BOUND \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE \
--restart-on-failure
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.-
RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (
maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie Instanzen auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-5,subnet=GVNIC_NAME_PREFIX-sub-5,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-6,subnet=GVNIC_NAME_PREFIX-sub-6,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-7,subnet=GVNIC_NAME_PREFIX-sub-7,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-8,subnet=GVNIC_NAME_PREFIX-sub-8,no-address \
--provisioning-model=SPOT \
--instance-termination-action=TERMINATION_ACTION \
--maintenance-policy=TERMINATE \
--no-restart-on-failure
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.TERMINATION_ACTION: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP(Standard) oderDELETE.
REST
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-5",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-6",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-7",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-7"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-8",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-8"
}
],
"reservationAffinity": {
"consumeReservationType": "NO_RESERVATION"
},
"scheduling": {
"instanceTerminationAction": "DELETE",
"maxRunDuration": {
"seconds": RUN_DURATION
},
"onHostMaintenance": "TERMINATE",
"provisioningModel": "FLEX_START"
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.RUN_DURATIONist die Dauer in Sekunden, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss zwischen600, d. h. 600 Sekunden (10 Minuten), und604800, also 604.800 Sekunden (7 Tage) liegen.
Reservierungsgebunden
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-5",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-6",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-7",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-7"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-8",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-8"
}
],
"reservationAffinity":{
"consumeReservationType":"SPECIFIC_RESERVATION",
"key":"compute.googleapis.com/reservation-name",
"values":[
"RESERVATION"
]
},
"scheduling":{
"provisioningModel":"RESERVATION_BOUND",
"instanceTerminationAction":"DELETE",
"onHostMaintenance": "TERMINATE",
"automaticRestart":true
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.-
RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (
maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie Instanzen auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-5",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-6",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-7",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-7"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-8",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-8"
}
],
"scheduling":
{
"provisioningModel": "SPOT",
"instanceTerminationAction": "TERMINATION_ACTION",
"onHostMaintenance": "TERMINATE",
"automaticRestart": false
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.TERMINATION_ACTION: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP(Standard) oderDELETE.
A3 High
Wenn Sie eine Instanzvorlage für A3 High-VMs erstellen möchten, müssen Sie vier zusätzliche Netzwerkschnittstellen für GPUDirect-TCPX-Traffic angeben. Falls noch nicht geschehen, müssen Sie vier VPC-Netzwerke erstellen, wie unter VPC-Netzwerke erstellen beschrieben.
gcloud
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
--reservation-affinity=none \
--instance-termination-action=DELETE \
--max-run-duration=RUN_DURATION \
--maintenance-policy=TERMINATE \
--provisioning-model=FLEX_START
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.RUN_DURATION: die Dauer, für die die angeforderten VMs ausgeführt werden sollen. Sie müssen den Wert als Anzahl von Tagen, Stunden, Minuten oder Sekunden gefolgt vond,h,mbzw.sformatieren. Geben Sie beispielsweise30mfür 30 Minuten oder1d2h3m4sfür einen Tag, zwei Stunden, drei Minuten und vier Sekunden an. Der Wert muss zwischen 10 Minuten und 7 Tagen liegen.
Reservierungsgebunden
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
--reservation-affinity=specific \
--reservation=RESERVATION \
--provisioning-model=RESERVATION_BOUND \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE \
--restart-on-failure
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.-
RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (
maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie Instanzen auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Verwenden Sie zum Erstellen einer regionalen Instanzvorlage den
Befehl gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-2,subnet=GVNIC_NAME_PREFIX-sub-2,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-3,subnet=GVNIC_NAME_PREFIX-sub-3,no-address \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-4,subnet=GVNIC_NAME_PREFIX-sub-4,no-address \
--provisioning-model=SPOT \
--instance-termination-action=TERMINATION_ACTION \
--maintenance-policy=TERMINATE \
--no-restart-on-failure
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.TERMINATION_ACTION: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP(Standard) oderDELETE.
REST
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
}
],
"reservationAffinity": {
"consumeReservationType": "NO_RESERVATION"
},
"scheduling": {
"instanceTerminationAction": "DELETE",
"maxRunDuration": {
"seconds": RUN_DURATION
},
"onHostMaintenance": "TERMINATE",
"provisioningModel": "FLEX_START"
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.RUN_DURATIONist die Dauer in Sekunden, für die die angeforderten VMs ausgeführt werden sollen. Der Wert muss zwischen600, d. h. 600 Sekunden (10 Minuten), und604800, also 604.800 Sekunden (7 Tage) liegen.
Reservierungsgebunden
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
}
],
"reservationAffinity":{
"consumeReservationType":"SPECIFIC_RESERVATION",
"key":"compute.googleapis.com/reservation-name",
"values":[
"RESERVATION"
]
},
"scheduling":{
"provisioningModel":"RESERVATION_BOUND",
"instanceTerminationAction":"DELETE",
"onHostMaintenance": "TERMINATE",
"automaticRestart":true
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.-
RESERVATION: entweder der Name der Reservierung oder ein bestimmter Block innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:So erstellen Sie Instanzen über mehrere Blöcke hinweg oder in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
Außerdem müssen Sie für einen einzelnen Block die MIG erstellen, indem Sie eine Arbeitslastrichtlinie anwenden, die eine Block-Colocation (
maxTopologyDistance=BLOCK) angibt. Compute Engine wendet die Richtlinie dann auf die Reservierung an und erstellt Instanzen im selben Block.So erstellen Sie Instanzen auf einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Senden Sie zum Erstellen einer regionalen Instanzvorlage eine POST-Anfrage an die
Methode regionInstanceTemplates.insert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-2",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-3",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-4",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-4"
}
],
"scheduling":
{
"provisioningModel": "SPOT",
"instanceTerminationAction": "TERMINATION_ACTION",
"onHostMaintenance": "TERMINATE",
"automaticRestart": false
}
}
}
Ersetzen Sie Folgendes:
INSTANCE_TEMPLATE_NAMEist der Name der Instanzvorlage.MACHINE_TYPEist der für die VM zu verwendende Maschinentyp. Geben Sie entweder einen A4- oder einen A3-Ultra-Maschinentyp an. Weitere Informationen finden Sie unter GPU-Maschinentypen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: die Region, in der Sie die Instanzvorlage erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.GVNIC_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der standardmäßigen VPC-Netzwerke und -Subnetze angegeben haben, die gVNIC-NICs verwenden.REGION: die Region des Subnetzwerks.TERMINATION_ACTION: Die Aktion, die ausgeführt werden soll, wenn Compute Engine die Instanz vorzeitig beendet, entwederSTOP(Standard) oderDELETE.
Nachdem Sie die Instanzvorlage erstellt haben, können Sie sie aufrufen, um ihre ID und ihre Instanzeigenschaften zu sehen.
Eine MIG erstellen.
Nachdem Sie alle vorherigen Schritte ausgeführt haben, erstellen Sie eine MIG basierend auf Ihrem Szenario:
| Szenario | Methode zum Erstellen einer MIG und der darin enthaltenen VMs | Beispiel |
|---|---|---|
| Sie haben mehrere oder parallele Jobs, die mit einer beliebigen Anzahl von VMs gestartet werden können. | Erstellen Sie eine MIG und geben Sie mit der Zielgröße die Anzahl der VMs an, die Sie in der Gruppe haben möchten. Weitere Informationen finden Sie unter MIG mit Zielgröße erstellen. |
ML-Inferenzjobs |
| Sie haben einen Job, der auf eine genaue Anzahl von VMs verteilt werden muss. | Erstellen Sie eine MIG ohne VMs und dann eine Anfrage zur Größenanpassung in der MIG.
Mit der Anfrage zur Größenanpassung können Sie alle VMs auf einmal erhalten. Weitere Informationen finden Sie unter MIG und Anfrage zur Größenanpassung erstellen. |
Verteilte ML-Trainings- und ‑Abstimmungsjobs |
MIG mit Zielgröße erstellen
Wenn Sie Ihren Job starten können, ohne alle VMs gleichzeitig zu erstellen, erstellen Sie eine MIG mit einer Zielgröße. Die Zielgröße bestimmt die Anzahl der VMs in der verwalteten Instanzgruppe. Die verwaltete Instanzgruppe beginnt mit dem Erstellen von VMs basierend auf der aktuellen Ressourcenverfügbarkeit. Wenn eine Ressource vorübergehend nicht verfügbar ist, versucht die verwaltete Instanzgruppe kontinuierlich, VMs zu erstellen, um die Zielgröße zu erreichen.
Wählen Sie eine der folgenden Optionen aus, um eine verwaltete Instanzgruppe mit einer Zielgröße zu erstellen:
gcloud
Verwenden Sie den Befehl instance-groups managed
create, um eine MIG mit einer angegebenen Zielgröße zu erstellen.
Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.
So erstellen Sie eine zonale oder regionale MIG:
- Verwenden Sie den folgenden Befehl, um eine zonale MIG zu erstellen:
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE
- Verwenden Sie den folgenden Befehl, um eine regionale MIG zu erstellen:
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --region=REGION
MIG_NAME: Name der MIG.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
TARGET_SIZE: Die Anzahl der VMs, die Sie in der MIG haben möchten.WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, können Sie das Flag--workload-policyentfernen.ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie eine Zone innerhalb der Region der Richtlinie an.REGION: die Region, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie dieselbe Region wie für die Richtlinie an. Bei einer regionalen MIG können Sie anstelle einer Region die Zonen in dieser Region mit dem--zones-Flag angeben.
REST
Wenn Sie eine MIG mit einer bestimmten Zielgröße erstellen möchten, senden Sie eine POST-Anfrage.
In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.
So erstellen Sie eine zonale oder regionale MIG:
- Wenn Sie eine zonale MIG erstellen möchten, senden Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Um eine regionale MIG zu erstellen, senden Sie eine
POST-Anfrage an die MethoderegionInstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } }
PROJECT_ID: Projekt-ID.ZONE: die Zone, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie eine Zone innerhalb der Region der Richtlinie an.REGION: die Region, in der Sie die MIG erstellen möchten. Wenn Sie eine Arbeitslastrichtlinie verwenden, geben Sie dieselbe Region wie für die Richtlinie an.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
MIG_NAME: Name der MIG.TARGET_SIZE: Die Anzahl der VMs, die Sie in der MIG haben möchten.WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policyWenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das FeldresourcePolicies.workloadPolicy.
MIG und Anfrage zur Größenanpassung erstellen
Wenn Sie mehrere VMs gleichzeitig benötigen, um einen Job zu starten, erstellen Sie eine MIG und dann eine Anfrage zur Größenänderung in der MIG, wie in diesem Abschnitt beschrieben.Wählen Sie eine der folgenden Optionen aus, um eine Anfrage zur Größenanpassung in einer MIG zu erstellen.
gcloud
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
-
So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine zonale MIG, wie unten beschrieben.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zone=ZONE -
Erstellen Sie mit dem Befehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der zonalen MIG:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine regionale MIG.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Erstellen Sie mit dem Betabefehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der regionalen MIG:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Reservierungsgebunden
Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
-
So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine zonale MIG, wie unten beschrieben.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Erstellen Sie mit dem Befehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der zonalen MIG:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine regionale MIG.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Erstellen Sie mit dem Betabefehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der regionalen MIG:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Spot
Bei den Befehlen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag --workload-policy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
-
So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine zonale MIG, wie unten beschrieben.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Erstellen Sie mit dem Befehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der zonalen MIG:gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
-
Erstellen Sie mit dem Befehl
instance-groups managed createeine regionale MIG.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Erstellen Sie mit dem Betabefehl
instance-groups managed resize-requests createeine Anfrage zur Größenanpassung in der regionalen MIG:gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
MIG_NAME: Name der MIG.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policyWenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das Flag--workload-policy.ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Auch für eine regionale MIG müssen Sie eine Zone angeben. Diese Zone muss die Zone sein, die das Profil für Ihr VPC-Netzwerk enthält, und eine Zone sein, in der der Maschinentyp verfügbar ist. Weitere Informationen finden Sie unter Einschränkungen.RESIZE_REQUEST_NAME: der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT: Die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen.REGION: die Region, in der sich die MIG befindet.
Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie mit dem Befehl beta instance-groups managed resize-requests create eine Liste der Namen der zu erstellenden VMs angeben.
Ersetzen Sie im Befehl das Flag --resize-request durch das Flag --instances.
REST
Die Parameter, die Sie angeben müssen, hängen von der Verbrauchsoption ab, die Sie für diese Bereitstellung verwenden. Wählen Sie den Tab aus, der dem Bereitstellungsmodell Ihrer Nutzungsoption entspricht.
Flex-Start
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
- So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
- Erstellen Sie eine zonale MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insertstellen.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Erstellen Sie eine zonale MIG, indem Sie eine
- So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
- So erstellen Sie eine regionale MIG und senden eine
POST-Anfrage an dieregionInstanceGroupManagers.insert-Methode:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine
POST-Anfrage an die Methodebeta.regionInstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- So erstellen Sie eine regionale MIG und senden eine
Reservierungsgebunden
In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
- So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
- Erstellen Sie eine zonale MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insertstellen.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Erstellen Sie eine zonale MIG, indem Sie eine
- So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
- So erstellen Sie eine regionale MIG und senden eine
POST-Anfrage an dieregionInstanceGroupManagers.insert-Methode:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine
POST-Anfrage an die Methodebeta.regionInstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- So erstellen Sie eine regionale MIG und senden eine
Spot
In den Anfragen zum Erstellen einer MIG wird eine Arbeitslastrichtlinie verwendet, um die VM-Platzierung anzugeben. Wenn Sie keine Workload-Richtlinie verwenden möchten, entfernen Sie das Feld resourcePolicies.workloadPolicy.
So erstellen Sie eine zonale oder regionale MIG und eine Anfrage zur Größenanpassung:
- So erstellen Sie eine zonale MIG und eine Anfrage zur Größenanpassung darin:
- Erstellen Sie eine zonale MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagers.insertstellen.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der zonalen MIG, indem Sie eine
POST-Anfrage an die MethodeinstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Erstellen Sie eine zonale MIG, indem Sie eine
- So erstellen Sie eine regionale MIG und eine Anfrage zur Größenanpassung darin:
- So erstellen Sie eine regionale MIG und senden eine
POST-Anfrage an dieregionInstanceGroupManagers.insert-Methode:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Erstellen Sie eine Anfrage zur Größenänderung in der regionalen MIG, indem Sie eine
POST-Anfrage an die Methodebeta.regionInstanceGroupManagerResizeRequests.insertsenden:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- So erstellen Sie eine regionale MIG und senden eine
PROJECT_ID: Projekt-ID.ZONE: die Zone, in der Sie die verwaltete Instanzgruppe erstellen möchten. Auch für eine regionale MIG müssen Sie eine Zone angeben. Diese Zone muss die Zone sein, die das Profil für Ihr VPC-Netzwerk enthält, und eine Zone sein, in der der Maschinentyp verfügbar ist. Weitere Informationen finden Sie unter Einschränkungen.REGION: Die Region, in der Sie die MIG erstellen möchten.INSTANCE_TEMPLATE_URL: Die URL der Instanzvorlage, die Sie zum Erstellen von VMs in der MIG verwenden möchten. Die URL kann entweder die ID oder den Namen der Instanzvorlage enthalten. Geben Sie einen der folgenden Werte an:- Für eine regionale Instanzvorlage:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Für eine globale Instanzvorlage:
INSTANCE_TEMPLATE_ID
- Für eine regionale Instanzvorlage:
MIG_NAME: Name der MIG.WORKLOAD_POLICY_URL(Optional): Die URL der Arbeitslastrichtlinie. Beispiel:projects/example-project/regions/us-central1/resourcePolicies/example-workload-policyWenn Sie keine Arbeitslastrichtlinie verwenden möchten, entfernen Sie das FeldresourcePolicies.workloadPolicy.RESIZE_REQUEST_NAME: der Name der Anfrage zur Größenänderung, der innerhalb der angegebenen MIG eindeutig sein muss. Andernfalls schlägt das Erstellen der Anfrage zur Größenänderung fehl.COUNT: die Anzahl der VMs, die gleichzeitig zur MIG hinzugefügt werden sollen
Wenn für Ihre Arbeitslast bestimmte VM-Namen erforderlich sind, können Sie eine Liste der Namen der zu erstellenden VMs angeben. Senden Sie dazu eine POST-Anfrage an die Methode beta.regionInstanceGroupManagerResizeRequests.insert für eine regionale MIG oder an die Methode beta.instanceGroupManagerResizeRequests.insert für eine zonale MIG. Ersetzen Sie im Anfragetext das Feld resizeBy durch das instanceNames-Feld.
Nächste Schritte
- Reservierungsnutzung prüfen
- Topologie einer Compute-Instanz ansehen
- VMs überwachen
- Fehlerhaften Host melden
- Anfragen zur Größenanpassung aufrufen, abbrechen oder löschen
- Fehlerbehebung bei der Nutzung von Reservierungen