In diesem Dokument wird beschrieben, wie Sie Richtlinien für verwaltete Instanzgruppen (Managed Instance Groups, MIGs) erstellen, die A4X Max-, A4X-, A4-, A3 Ultra-, A3 Mega-, A3 High- (8 GPUs) oder H4D-Compute Engine-Instanzen verwenden. Weitere Informationen zu den Anforderungen und Einschränkungen die beim Erstellen von Arbeitslastrichtlinien gelten, finden Sie unter Arbeitslastrichtlinien.
Mit einer Arbeitslastrichtlinie können Sie die Platzierung oder Topologie für die Compute Engine-Instanzen in Ihrer MIG angeben. Sie können beispielsweise Arbeitslastrichtlinien verwenden, um Compute-Instanzen näher beieinander zu platzieren und so die Netzwerklatenz für Arbeitslasten mit künstlicher Intelligenz (KI), maschinellem Lernen (ML) oder Hochleistungs-Computing (HPC) zu minimieren.
Hinweis
-
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben.
Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud Dienste und APIs überprüft. Wenn Sie
Code oder Beispiele aus einer lokalen Entwicklungsumgebung ausführen möchten, können Sie sich so bei
Compute Engine authentifizieren:
Wählen Sie den Tab für die Verwendung der Beispiele auf dieser Seite aus:
gcloud
-
Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
gcloud initWenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
-
- Legen Sie eine Standardregion und -zone fest.
REST
Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.
Installieren Sie die Google Cloud CLI.
Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
Weitere Informationen finden Sie in der Google Cloud Authentifizierungsdokumentation unter Für die Verwendung von REST authentifizieren.
Erforderliche Rollen
Bitten Sie Ihren Administrator, Ihnen für das Projekt die IAM-Rolle Compute Instance Admin (Version 1) (roles/compute.instanceAdmin.v1) zu gewähren, um die Berechtigungen zu erhalten, die Sie zum Erstellen und Anwenden von Arbeitslastrichtlinien auf MIGs benötigen.
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierte Rolle enthält die Berechtigungen, die zum Erstellen und Anwenden von Arbeitslastrichtlinien auf MIGs erforderlich sind. Maximieren Sie den Abschnitt Erforderliche Berechtigungen , um die notwendigen Berechtigungen anzuzeigen, die erforderlich sind:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Arbeitslastrichtlinien zu erstellen und auf MIGs anzuwenden:
-
Zum Erstellen einer Arbeitslastrichtlinie:
compute.resourcePolicies.createfür das Projekt
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Arbeitslastrichtlinie erstellen
Verwenden Sie eine der folgenden Methoden, um eine Arbeitslastrichtlinie zu erstellen. Die Methode hängt von der Maschinenserie ab, die von den Compute-Instanzen in Ihrer MIG verwendet wird:
Arbeitslastrichtlinie für A4X Max- oder A4X-Instanzen erstellen
Arbeitslastrichtlinie für A4-, A3 Ultra-, A3 Mega-, A3 High- (8 GPUs) oder H4D-Instanzen erstellen
Arbeitslastrichtlinie für A4X Max- oder A4X-Instanzen erstellen
Wenn Sie eine Arbeitslastrichtlinie auf A4X Max- oder A4X-Instanzen in einer MIG anwenden, müssen Sie beim Erstellen der Richtlinie einen Wert für die Beschleunigertopologie angeben. Dadurch können Ihre Arbeitslasten eine nicht blockierende Netzwerkleistung im großen Maßstab erzielen.
Wählen Sie eine der folgenden Optionen aus, um eine Arbeitslastrichtlinie für A4X Max- oder A4X-Instanzen zu erstellen:
gcloud
Verwenden Sie den
gcloud compute resource-policies create workload-policy Befehl
mit dem --accelerator-topology=1x72 Flag, um eine Arbeitslastrichtlinie für A4X Max- oder A4X-Instanzen zu erstellen:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
Ersetzen Sie Folgendes:
WORKLOAD_POLICY_NAME: der Name für Ihre Arbeitslastrichtlinie.REGION: die Region, in der Sie Ihre Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Unter Verfügbare Regionen und Zonenfinden Sie eine Liste der Regionen, in denen die Maschinentypen A4X Max oder A4X verfügbar sind.
REST
Senden Sie eine POST
Anfrage an die
resourcePolicies.insert Methode, um eine Arbeitslastrichtlinie für A4X Max- oder A4X-Instanzen zu erstellen.
Geben Sie im Anfragetext das Feld acceleratorTopology an, das auf 1x72 gesetzt ist:
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
Ersetzen Sie Folgendes:
PROJECT_ID: die ID des Projekts, in dem Sie Ihre Arbeitslastrichtlinie erstellen möchten.REGION: die Region, in der Sie Ihre Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Unter Verfügbare Regionen und Zonenfinden Sie eine Liste der Regionen, in denen die Maschinentypen A4X Max oder A4X verfügbar sind.WORKLOAD_POLICY_NAME: der Name für Ihre Arbeitslastrichtlinie.
Arbeitslastrichtlinie für A4-, A3 Ultra-, A3 Mega-, A3 High- (8 GPUs) oder H4D-Instanzen erstellen
Wenn Sie eine Arbeitslastrichtlinie auf A4-, A3 Ultra-, A3 Mega-, A3 High- (8 GPUs) oder H4D-Instanzen in einer MIG anwenden möchten, empfehlen wir, beim Erstellen der Richtlinie einen Wert für den maximalen Topologieabstand anzugeben. Dadurch wird eine engere Platzierung zwischen den Compute-Instanzen gewährleistet. Je kompakter die von Ihnen angegebene Platzierung ist, desto weniger Ressourcen sind jedoch möglicherweise in der Zone verfügbar, in der Sie Ihre Compute-Instanzen erstellen möchten.
Wählen Sie eine der folgenden Optionen aus, um eine Arbeitslastrichtlinie für A4-, A3 Ultra-, A3 Mega- oder A3 High-Instanzen (8 GPUs) zu erstellen:
gcloud
Verwenden Sie den
gcloud compute resource-policies create workload-policy Befehl, um eine Arbeitslastrichtlinie zu erstellen. Geben Sie die folgenden Flags im Befehl an, je nachdem, wie nah Sie die Compute-Instanzen in einer MIG platzieren möchten:
Wenn Sie Ihre Compute-Instanzen nach Möglichkeit nah beieinander platzieren möchten, geben Sie das Flag
--type=high-throughputan:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONWenn Sie die Platzierung Ihrer Compute-Instanzen weiter steuern möchten, geben Sie die Flags
--max-topology-distanceund--type=high-throughputan:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
Ersetzen Sie Folgendes:
WORKLOAD_POLICY_NAME: der Name für Ihre Arbeitslastrichtlinie.REGION: die Region, in der Sie Ihre Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Unter Verfügbare Regionen und Zonen finden Sie eine Liste der Regionen, in denen GPU-Maschinentypen verfügbar sind.TOPOLOGY_DISTANCE: der maximale Topologieabstand. Ein kürzerer maximaler Abstand kann die Wahrscheinlichkeit der VM-Verfügbarkeit verringern. Geben Sie einen der folgenden Werte an:Wenn Sie A4- oder H4D-Instanzen im selben Cluster platzieren möchten:
CLUSTERWenn Sie A4-, A3 Ultra-, A3 Mega-, A3 High- (8 GPUs) oder H4D-Instanzen im selben Block platzieren möchten:
BLOCKWenn Sie A4-, A3 Ultra- oder H4D-Instanzen im selben Unterblock platzieren möchten:
SUBBLOCK
REST
Senden Sie eine POST Anfrage an die
resourcePolicies.insert Methode, um eine Arbeitslastrichtlinie zu erstellen. Geben Sie im Anfragetext die folgenden Felder an, je nachdem, wie nah Sie die Compute-Instanzen in einer MIG platzieren möchten:
Wenn Sie Ihre Compute-Instanzen nach Möglichkeit nah beieinander platzieren möchten, geben Sie im Anfragetext das Feld
typean:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }Wenn Sie die Platzierung Ihrer Compute-Instanzen weiter steuern möchten, geben Sie im Anfragetext die Felder
maxTopologyDistanceundtypean:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
Ersetzen Sie Folgendes:
PROJECT_ID: die ID des Projekts, in dem Sie Ihre Arbeitslastrichtlinie erstellen möchten.REGION: die Region, in der Sie Ihre Arbeitslastrichtlinie erstellen möchten. Geben Sie eine Region an, in der Sie die MIG erstellen möchten und in der der Maschinentyp verfügbar ist, den Sie verwenden möchten. Unter Verfügbare Regionen und Zonen finden Sie eine Liste der Regionen, in denen GPU-Maschinentypen verfügbar sind.WORKLOAD_POLICY_NAME: der Name für Ihre Arbeitslastrichtlinie.TOPOLOGY_DISTANCE: der maximale Topologieabstand. Ein kürzerer maximaler Abstand kann die Wahrscheinlichkeit der VM-Verfügbarkeit verringern. Geben Sie einen der folgenden Werte an:Wenn Sie A4- oder H4D-Instanzen im selben Cluster platzieren möchten:
CLUSTERWenn Sie A4-, A3 Ultra-, A3 Mega-, A3 High- (8 GPUs) oder H4D-Instanzen im selben Block platzieren möchten:
BLOCKWenn Sie A4-, A3 Ultra- oder H4D-Instanzen im selben Unterblock platzieren möchten:
SUBBLOCK
Nächste Schritte
Nachdem Sie eine Arbeitslastrichtlinie erstellt haben, erfahren Sie, wie Sie sie auf eine MIG anwenden: