In diesem Dokument wird beschrieben, wie Sie Compute Engine-Instanzen in großen Mengen erstellen, die beschleunigungsoptimierte A4X Max-Maschinentypen verwenden. Informationen zu den Optionen zum Erstellen von Compute-Instanzen und Clustern finden Sie auf der Seite Bereitstellungsoptionen.
A4X Max-Instanztyp
Eine Compute Engine-Instanz, oder Compute-Instanz, ist eine Rechenressource, die in der Infrastruktur von Google gehostet wird und entweder eine virtuelle Maschine (VM) oder eine Bare-Metal-Instanz sein kann. A4X Max-Instanzen sind als Bare-Metal-Instanzen verfügbar. Diese unterscheiden sich von VM-Instanzen dadurch, dass sie direkten, nicht virtualisierten Zugriff auf die zugrunde liegende physische Hardware bieten. Weitere Informationen zum Maschinentyp „A4X Max“ finden Sie in der Compute Engine-Dokumentation unter A4X Max-Serie.
Hinweis
Bevor Sie A4X Max-Instanzen im Bulk erstellen, führen Sie die folgenden Schritte aus, falls Sie dies noch nicht getan haben:
- Nutzungsoption auswählen: Die von Ihnen gewählte Nutzungsoption bestimmt, wie Sie GPU-Ressourcen beziehen und nutzen.
Weitere Informationen finden Sie unter Nutzungsoption auswählen.
- Kapazität abrufen: Der Prozess zum Abrufen von Kapazität unterscheidet sich für jede Verbrauchsoption.
Informationen zum Erhalten von Kapazität für die von Ihnen gewählte Verbrauchsoption finden Sie unter Kapazitätsübersicht.
Beschränkungen
Wenn Sie A4X Max-Instanzen im Bulk erstellen, gelten die folgenden Einschränkungen:
- Sie erhalten weder Rabatte für kontinuierliche Nutzung noch flexible Rabatte für zugesicherte Nutzung für Instanzen, die diesen Maschinentyp verwenden.
- Sie können Instanzen nur in bestimmten Regionen und Zonen erstellen.
- Sie können keinen nichtflüchtigen Speicher (regional oder zonenbasiert) verwenden. Sie können nur Google Cloud Hyperdisk verwenden.
- Dieser Maschinentyp ist nur auf der NVIDIA Grace-Plattform verfügbar.
- Änderungen des Maschinentyps werden für A4X Max nicht unterstützt. Wenn Sie zu diesem Maschinentyp wechseln oder ihn verlassen möchten, müssen Sie eine neue Instanz erstellen.
- Sie können Windows-Betriebssysteme nicht auf diesem Maschinentyp ausführen. Eine Liste der unterstützten Linux-Betriebssysteme finden Sie unter Unterstützte Betriebssysteme für GPU-Instanzen.
- A4X Max-Instanzen unterstützen Folgendes nicht:
- Sie können Hyperdisk ML-Laufwerke, die vor dem 4. Februar 2026 erstellt wurden, nicht an A4X Max-Maschinentypen anhängen.
Erforderliche Rollen
Um die Berechtigungen zu erhalten, die Sie für die Erstellung von Compute-Instanzen im Bulk benötigen, bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Compute Instance Admin (v1) (roles/compute.instanceAdmin.v1) für das Projekt zu gewähren.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen von Compute-Instanzen im Bulk erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen, um die notwendigen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Compute-Instanzen im Bulk zu erstellen:
compute.instances.createfür das Projekt-
Zum Erstellen der VM mit einem benutzerdefinierten Image:
compute.images.useReadOnlyfür das Image -
Zum Erstellen der VM mit einem Snapshot:
compute.snapshots.useReadOnlyfür den Snapshot -
Zum Erstellen der VM mit einer Instanzvorlage:
compute.instanceTemplates.useReadOnlyfür die Instanzvorlage -
Zum Angeben eines Subnetzes für Ihre VM:
compute.subnetworks.usefür das Projekt oder für das ausgewählte Subnetz -
Zum Festlegen einer statischen IP-Adresse für die VM:
compute.addresses.usefür das Projekt -
Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein VPC-Netzwerk verwenden:
compute.subnetworks.useExternalIpfür das Projekt oder für das ausgewählte Subnetz -
Zum Zuweisen eines Legacy-Netzwerks zur VM:
compute.networks.usefür das Projekt -
Zum Zuweisen einer externen IP-Adresse zur VM, wenn Sie ein Legacy-Netzwerk verwenden:
compute.networks.useExternalIpfür das Projekt -
Zum Festlegen von Metadaten der VM-Instanz für die VM:
compute.instances.setMetadatafür das Projekt -
Zum Festlegen von Tags für die VM:
compute.instances.setTagsfür die VM -
Zum Festlegen von Labels für die VM:
compute.instances.setLabelsfür die VM -
Zum Festlegen eines Dienstkontos für die VM:
compute.instances.setServiceAccountfür die VM -
Zum Erstellen eines neuen Laufwerks für die VM:
compute.disks.createfür das Projekt -
Zum Anhängen eines vorhandenen Laufwerks im Lese- oder Lese-/Schreibmodus:
compute.disks.usefür das Laufwerk -
Zum Anhängen eines vorhandenen Laufwerks im Lesemodus:
compute.disks.useReadOnlyfür das Laufwerk
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
A4X Max – Grundlagen
Ein A4X Max-Cluster ist in eine Hierarchie von Blöcken und Unterblöcken unterteilt, um eine nicht blockierende Netzwerkleistung im großen Maßstab zu ermöglichen. Das Verständnis dieser Topologie ist entscheidend, wenn Sie Kapazität reservieren und Arbeitslasten bereitstellen.
- A4X Max-Instanz
- Eine A4X Max-Instanz ist ein einzelner A4X Max-Maschinentyp mit vier angehängten GPUs.
- Unterblock
- Ein Unterblock ist die Grundeinheit der A4X Max-Kapazität. Bei A4X Max besteht ein Unterblock aus 18 A4X Max-Instanzen (72 GPUs). Diese Instanzen bilden eine NVLink-Domain und sind über ein Multi-Node-NVLink-System verbunden. Sie erstellen einen A4X Max-Unterblock, indem Sie eine Richtlinie für kompakte Platzierung anwenden, in der eine
1x72-Topologie angegeben ist. - Blockieren
- Ein A4X Max-Block besteht aus 25 Unterblöcken (NVLink-Domains) mit insgesamt bis zu 450 A4X Max-Instanzen (1.800 GPUs). Die Unterblöcke sind auf die Rails ausgerichtet, um eine effiziente Skalierung zu ermöglichen. Für jeden Unterblock ist eine kompakte Platzierungsrichtlinie erforderlich. Daher können Sie für einen einzelnen A4X Max-Block 25 Richtlinien für kompakte Platzierung erstellen.
Die folgende Tabelle zeigt die unterstützten Topologieoptionen für A4X Max-Instanzen:
Topologie (gpuTopology) |
Anzahl der GPUs | Anzahl der Instanzen |
|---|---|---|
1x72 |
72 | 18 |
Übersicht
Das Erstellen von Instanzen im Bulk mit dem Maschinentyp A4X Max umfasst die folgenden Schritte:
VPC-Netzwerke erstellen
Um das Netzwerk für A4X Max-Maschinentypen einzurichten, erstellen Sie zwei VPC-Netzwerke für die folgenden Netzwerkschnittstellen:
- 1 reguläres VPC-Netzwerk mit zwei Subnetzen für die IDPF-Netzwerkschnittstellen (NICs). Sie werden für die Kommunikation zwischen Hosts verwendet.
- 1 VPC-Netzwerk mit dem RoCE-Netzwerkprofil
für die CX-8-NICs beim Erstellen mehrerer A4X Max-Unterblöcke. Das RoCE-VPC-Netzwerk verwendet ein einzelnes Subnetz mit dem Namen
default-subnet-1-RDMA_NAME_PREFIX-net, das automatisch bereitgestellt wird. Alle acht CX-8-NICs verwenden dieses Subnetz. Diese Netzwerkkarten verwenden RDMA over Converged Ethernet (RoCE) und bieten so die Kommunikation mit hoher Bandbreite und niedriger Latenz, die für die Skalierung auf mehrere A4X Max-Unterblöcke erforderlich ist. Bei einem einzelnen A4X Max-Subblock können Sie dieses VPC-Netzwerk überspringen, da die direkte GPU-zu-GPU-Kommunikation innerhalb eines einzelnen Subblocks über das Multi-Node-NVLink erfolgt.
Weitere Informationen zur NIC-Anordnung finden Sie unter Netzwerkbandbreite und NIC-Anordnung prüfen.
Sie können die Netzwerke entweder manuell anhand der Anleitungen oder automatisch mit dem bereitgestellten Skript erstellen.
Anleitungen
So erstellen Sie die Netzwerke:
- Informationen zum Erstellen der regulären VPC-Netzwerke für die gVNICs finden Sie unter VPC-Netzwerke erstellen und verwalten.
- Informationen zum Erstellen des RoCE-VPC-Netzwerks finden Sie unter VPC-Netzwerk für RDMA-NICs erstellen.
Für diese VPC-Netzwerke empfehlen wir, die maximale Übertragungseinheit (Maximum Transmission Unit, MTU) auf einen höheren Wert festzulegen.
Für A4X Max-Maschinentypen wird eine MTU von 8896 Bytes empfohlen.
Die empfohlenen MTU-Einstellungen für andere GPU-Maschinentypen finden Sie unter MTU-Einstellungen für GPU-Maschinentypen.
Skript
So erstellen Sie die Netzwerke:
Für diese VPC-Netzwerke empfehlen wir, die maximale Übertragungseinheit (Maximum Transmission Unit, MTU) auf einen höheren Wert festzulegen.
Für A4X Max-Maschinentypen wird eine MTU von 8896 Bytes empfohlen.
Die empfohlenen MTU-Einstellungen für andere GPU-Maschinentypen finden Sie unter MTU-Einstellungen für GPU-Maschinentypen.
Verwenden Sie das folgende Skript, um reguläre VPC-Netzwerke für die IDPF-NICs zu erstellen.
#!/bin/bash # Create regular VPC network for the IDPF NICs gcloud compute networks create IDPF_NETWORK_PREFIX-net \ --subnet-mode=custom \ --mtu=8896 \ --enable-ula-internal-ipv6 # Create subnets for the IDPF NICs for N in $(seq 0 1); do gcloud compute networks subnets create IDPF_NETWORK_PREFIX-$N \ --network=IDPF_NETWORK_PREFIX-net \ --region=REGION \ --stack-type=IPV6_ONLY \ --ipv6-access-type=INTERNAL done gcloud compute firewall-rules create IDPF_NETWORK_PREFIX-internal \ --network=IDPF_NETWORK_PREFIX-net \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,58 \ --source-ranges=IP_RANGEWenn Sie mehrere A4X Max-Subblöcke benötigen, verwenden Sie das folgende Skript, um das RoCE-VPC-Netzwerk und die Subnetze für die vier CX-8-NICs auf jeder A4X Max-Instanz zu erstellen.
#!/bin/bash # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for RDMA NICs gcloud compute networks create RDMA_NAME_PREFIX-net \ --network-profile=ZONE-vpc-roce-metal \ --subnet-mode custom \ --mtu=8896 # For RoCE VPC networks for bare metal instances, a single subnet named # default-subnet-1-RDMA_NAME_PREFIX-net is automatically provided. # For more details, see https://cloud.google.com/vpc/docs/rdma-network-profiles.Ersetzen Sie Folgendes:
IDPF_NETWORK_PREFIX: Das benutzerdefinierte Namenspräfix, das für die regulären VPC-Netzwerke und -Subnetze für die IDPF-NICs verwendet werden soll.RDMA_NAME_PREFIX: Das benutzerdefinierte Namenspräfix, das für das RoCE-VPC-Netzwerk und die Subnetze für die CX-8-NICs verwendet werden soll.ZONE: Geben Sie eine Zone an, in der der Maschinentyp, den Sie verwenden möchten, verfügbar ist, z. B.us-central1-a. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.REGION: Die Region, in der Sie die Subnetze erstellen möchten. Diese Region muss der angegebenen Zone entsprechen. Wenn Ihre Zone beispielsweiseus-central1-aist, lautet Ihre Regionus-central1.IP_RANGE: Der IP-Bereich, der für die SSH-Firewallregeln verwendet werden soll.
- Optional: Prüfen Sie die Netzwerkeinstellungen in der Google Cloud -Konsole, um zu bestätigen, dass die VPC-Netzwerkressourcen erfolgreich erstellt wurden:
- Rufen Sie in der Google Cloud Console die Seite VPC-Netzwerke auf.
- Suchen Sie in der Liste nach den Netzwerken, die Sie im vorherigen Schritt erstellt haben.
- Klicken Sie auf den Namen des Netzwerks, um die Subnetze, Firewallregeln und andere Netzwerkeinstellungen aufzurufen.
Kompakte Platzierungsrichtlinie erstellen
Wählen Sie eine der folgenden Optionen aus, um eine Richtlinie für kompakte Platzierung zu erstellen:gcloud
Verwenden Sie zum Erstellen einer Richtlinie für kompakte Platzierung den
Befehl gcloud beta compute resource-policies create group-placement:
gcloud beta compute resource-policies create group-placement POLICY_NAME \
--collocation=collocated \
--gpu-topology=1x72 \
--region=REGION
Ersetzen Sie Folgendes:
POLICY_NAME: der Name der Richtlinie für kompakte Platzierung.REGION: Die Region, in der Sie die Richtlinie für kompakte Platzierungen erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.
REST
Senden Sie zum Erstellen einer Richtlinie für kompakte Platzierung eine POST-Anfrage an die Beta-Methode resourcePolicies.insert.
POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "POLICY_NAME",
"groupPlacementPolicy": {
"collocation": "COLLOCATED",
"gpuTopology": "1x72"
}
}
Ersetzen Sie Folgendes:
PROJECT_ID: Ihre Projekt-ID.POLICY_NAME: der Name der Richtlinie für kompakte Platzierung.REGION: Die Region, in der Sie die Richtlinie für kompakte Platzierungen erstellen möchten. Geben Sie eine Region an, in der der gewünschte Maschinentyp verfügbar ist. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.
A4X Max-Instanzen im Bulk erstellen
Um eine GPU-Topologie von 1x72 zu erhalten, erstellen Sie 18 A4X Max-Instanzen. Wenden Sie beim Erstellen der Instanzen die Richtlinie für kompakte Platzierung an, in der das Feld gpuTopology angegeben ist. Durch Anwenden der Richtlinie wird sichergestellt, dass Compute Engine alle 18 A4X Max-Instanzen in einem Subblock erstellt, um eine NVLink-Domain zu verwenden.
Wenn in einem Unterblock nicht genügend Kapazität für alle 18 A4X Max-Instanzen vorhanden ist, schlägt die Massenerstellung fehl und es wird keine Instanz erstellt.
Wenn Ihre Arbeitslast mit weniger als 18 A4X Max-Instanzen ausgeführt werden kann, können Sie das Feld minCount auf die Mindestanzahl von Instanzen festlegen, die für Ihre Arbeitslast erforderlich sind. Wenn Sie die verfügbare Kapazität nutzen möchten, legen Sie das Feld minCount auf 1 fest.
Wählen Sie eine der folgenden Optionen aus, um A4X Max-Instanzen im Bulk zu erstellen.
Mit den folgenden Befehlen wird auch der Zugriffsbereich für Ihre Instanzen festgelegt. Um die Berechtigungsverwaltung zu vereinfachen, empfiehlt Google, den Zugriffsbereich für eine Instanz aufcloud-platform-Zugriff festzulegen und dann mit IAM-Rollen zu definieren, auf welche Dienste die Instanz zugreifen kann. Weitere Informationen finden Sie unter Best Practices für Bereiche.
gcloud
Verwenden Sie den
Befehl gcloud compute instances bulk create, um A4X Max-Instanzen im Bulk zu erstellen.
gcloud compute instances bulk create \
--name-pattern=NAME_PATTERN \
--count=COUNT \
--machine-type=a4x-maxgpu-4g-metal \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=IDPF,network=IDPF_NETWORK_PREFIX-net,stack-type=IPV6_ONLY,subnet=IDPF_NETWORK_PREFIX-sub-0 \
--network-interface=nic-type=IDPF,network=IDPF_NETWORK_PREFIX-net,stack-type=IPV6_ONLY,subnet=IDPF_NETWORK_PREFIX-sub-1,no-address \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--network-interface=subnet=default-subnet-1-RDMA_NAME_PREFIX-net,stack-type=IPV6_ONLY,nic-type=mrdma \
--reservation-affinity=specific \
--reservation=RESERVATION \
--provisioning-model=RESERVATION_BOUND \
--instance-termination-action=TERMINATION_ACTION \
--maintenance-policy=TERMINATE \
--restart-on-failure \
--resource-policies=POLICY_NAME
Ersetzen Sie Folgendes:
NAME_PATTERN: das Namensmuster, das für die A4X Max-Instanzen verwendet werden soll. Wenn Sie beispielsweiseinstance-#für das Namensmuster verwenden, werden A4X Max-Instanzen mit Namen wieinstance-1undinstance-2bis zu der durch--countangegebenen Anzahl von A4X Max-Instanzen generiert.COUNT: Die Anzahl der zu erstellenden A4X Max-Instanzen.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.REGION: Geben Sie eine Region an, in der der Maschinentyp, den Sie verwenden möchten, verfügbar ist. Sie müssen dieselbe Region wie für die Richtlinie für kompakte Platzierung verwenden. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.DISK_SIZE: Die Größe des Bootlaufwerks in GB.IDPF_NETWORK_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die IDPF-NICs verwenden.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.-
RESERVATION: Der Name der Reservierung, eines Blocks oder eines Unterblocks innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:- So erstellen Sie A4X Max-Instanzen in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME - So erstellen Sie A4X Max-Instanzen in einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME - So erstellen Sie A4X Max-Instanzen in einem bestimmten Subblock:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
- So erstellen Sie A4X Max-Instanzen in einem einzelnen Block:
TERMINATION_ACTION: Gibt an, ob Compute Engine die A4X Max-Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).POLICY_NAME: der Name der Richtlinie für kompakte Platzierung.
REST
Wenn Sie A4X Max-Instanzen im Bulk erstellen möchten, senden Sie eine POST-Anfrage an die
Methode instances.bulkInsert.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/bulkInsert
{
"namePattern":"NAME_PATTERN",
"count":"COUNT",
"instanceProperties":{
"machineType":"a4x-maxgpu-4g-metal",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/IDPF_NETWORK_PREFIX-net",
"nicType": "IDPF",
"stackType": "IPV6_ONLY",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/IDPF_NETWORK_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/IDPF_NETWORK_PREFIX-net",
"nicType": "IDPF",
"stackType": "IPV6_ONLY",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/IDPF_NETWORK_PREFIX-sub-1"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
},
{
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/default-subnet-1-RDMA_NAME_PREFIX-net",
"nicType": "MRDMA",
"stackType": "IPV6_ONLY"
}
],
"reservationAffinity":{
"consumeReservationType":"SPECIFIC_RESERVATION",
"key":"compute.googleapis.com/reservation-name",
"values":[
"RESERVATION"
]
},
"scheduling":{
"provisioningModel":"RESERVATION_BOUND",
"instanceTerminationAction":"DELETE",
"onHostMaintenance": "TERMINATE",
"automaticRestart":true
},
"resourcePolicies": [
"projects/PROJECT_ID/regions/REGION/resourcePolicies/POLICY_NAME"
]
}
}
Ersetzen Sie Folgendes:
PROJECT_ID: die Projekt-ID des Projekts, in dem Sie die A4X Max-Instanz erstellen möchten.ZONE: Geben Sie eine Zone an, in der der Maschinentyp, den Sie verwenden möchten, verfügbar ist. Sie müssen eine Zone in derselben Region wie die Richtlinie für kompakte Platzierung verwenden. Informationen zu Regionen finden Sie unter GPU-Verfügbarkeit nach Regionen und Zonen.NAME_PATTERN: das Namensmuster, das für die A4X Max-Instanzen verwendet werden soll. Wenn Sie beispielsweiseinstance-#für das Namensmuster verwenden, werden A4X Max-Instanzen mit Namen wieinstance-1undinstance-2bis zu der durch--countangegebenen Anzahl von A4X Max-Instanzen generiert.COUNT: Die Anzahl der zu erstellenden A4X Max-Instanzen.VM_NAME: der Name der VM.DISK_SIZE: Die Größe des Bootlaufwerks in GB.IMAGE_PROJECT: die Projekt-ID des Betriebssystem-Images.IMAGE_FAMILY: die Image-Familie des Betriebssystem-Images, das Sie verwenden möchten. Eine Liste der unterstützten Betriebssysteme finden Sie unter Unterstützte Betriebssysteme.NETWORK_PROJECT_ID: die Projekt-ID des Netzwerks.IDPF_NETWORK_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die IDPF-NICs verwenden.REGION: die Region des Subnetzwerks.RDMA_NAME_PREFIX: Das Namenspräfix, das Sie beim Erstellen der VPC-Netzwerke und ‑Subnetze angegeben haben, die RDMA-NICs verwenden.-
RESERVATION: Der Name der Reservierung, eines Blocks oder eines Unterblocks innerhalb einer Reservierung. Informationen zum Abrufen des Reservierungsnamens oder der verfügbaren Blöcke finden Sie unter Reservierte Kapazität ansehen. Wählen Sie je nach Ihren Anforderungen an die Platzierung der Instanz eine der folgenden Optionen aus:- So erstellen Sie A4X Max-Instanzen in einem einzelnen Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME - So erstellen Sie A4X Max-Instanzen in einem bestimmten Block:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME - So erstellen Sie A4X Max-Instanzen in einem bestimmten Subblock:
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME/reservationSubBlocks/RESERVATION_SUBBLOCK_NAME
- So erstellen Sie A4X Max-Instanzen in einem einzelnen Block:
TERMINATION_ACTION: Gibt an, ob Compute Engine die A4X Max-Instanz am Ende des Reservierungszeitraums beendet (STOP) oder löscht (DELETE).PROJECT_ID: die Projekt-ID der Richtlinie für kompakte Platzierung.REGION: die Region der Richtlinie für kompakte Platzierungen.POLICY_NAME: der Name der Richtlinie für kompakte Platzierung.
Weitere Informationen zu den Konfigurationsoptionen zum Erstellen von Compute-Instanzen im Bulk finden Sie in der Compute Engine-Dokumentation unter VMs im Bulk erstellen.
Nächste Schritte
- Arbeitslasten ausführen – Übersicht
- Fehlerbehebung bei der Nutzung von Reservierungen
- VM-Topologie ansehen