Ce document explique comment créer des règles pour les groupes d'instances gérés (MIG) qui comportent des instances Compute Engine A4X Max, A4X, A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D. Pour en savoir plus sur les exigences et les limites que vous appliquez lorsque vous créez des règles de charge de travail, consultez À propos des règles de charge de travail.
Une règle de charge de travail vous permet de spécifier l'emplacement ou la topologie des instances Compute Engine de votre MIG. Par exemple, vous pouvez utiliser des stratégies de charge de travail pour placer les instances de calcul plus près les unes des autres, ce qui minimise la latence réseau pour les charges de travail d'intelligence artificielle (IA), de machine learning (ML) ou de calcul hautes performances (HPC).
Avant de commencer
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification permet de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :
Sélectionnez l'onglet correspondant à la façon dont vous prévoyez d'utiliser les exemples de cette page :
gcloud
-
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
-
- Définissez une région et une zone par défaut.
REST
Pour utiliser les exemples API REST de cette page dans un environnement de développement local, vous devez utiliser les identifiants que vous fournissez à la gcloud CLI.
Installez la Google Cloud CLI.
Si vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
Pour en savoir plus, consultez la section S'authentifier pour utiliser REST dans la documentation sur l'authentification Google Cloud .
Rôles requis
Pour obtenir les autorisations nécessaires pour créer et appliquer des stratégies de charge de travail aux MIG, demandez à votre administrateur de vous accorder le rôle IAM Administrateur d'instances Compute (v1) (roles/compute.instanceAdmin.v1) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Ce rôle prédéfini contient les autorisations requises pour créer et appliquer des règles de charge de travail aux MIG. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour créer et appliquer des règles de charge de travail aux MIG :
-
Pour créer une règle de charge de travail :
compute.resourcePolicies.createsur le projet
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Créer une règle de charge de travail
Pour créer une règle de charge de travail, utilisez l'une des méthodes suivantes en fonction de la série de machines utilisée par les instances de calcul de votre MIG :
Créer une règle de charge de travail pour les instances A4X Max ou A4X
Si vous appliquez une règle de charge de travail aux instances A4X Max ou A4X d'un MIG, vous devez spécifier une valeur de topologie d'accélérateur lorsque vous créez votre règle. Cette action aide vos charges de travail à atteindre des performances réseau à grande échelle et non bloquantes.
Pour créer une règle de charge de travail pour les instances A4X Max ou A4X, sélectionnez l'une des options suivantes :
gcloud
Pour créer une règle de charge de travail pour les instances A4X Max ou A4X, utilisez la commande gcloud compute resource-policies create workload-policy avec l'option --accelerator-topology=1x72 :
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--accelerator-topology=1x72 \
--type=high-throughput \
--region=REGION
Remplacez les éléments suivants :
WORKLOAD_POLICY_NAME: nom de votre règle de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines A4X Max ou A4X sont disponibles, consultez Régions et zones disponibles.
REST
Pour créer une règle de charge de travail pour les instances A4X Max ou A4X, envoyez une requête POST à la méthode resourcePolicies.insert.
Dans le corps de la requête, incluez le champ acceleratorTopology défini sur 1x72 :
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies
{
"name": "WORKLOAD_POLICY_NAME",
"workloadPolicy": {
"acceleratorTopology": "1x72",
"type": "HIGH_THROUGHPUT"
}
}
Remplacez les éléments suivants :
PROJECT_ID: ID du projet dans lequel créer votre règle de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines A4X Max ou A4X sont disponibles, consultez Régions et zones disponibles.WORKLOAD_POLICY_NAME: nom de votre règle de charge de travail.
Créer une règle de charge de travail pour les instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D
Si vous souhaitez appliquer une règle de charge de travail aux instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D dans un MIG, nous vous recommandons de spécifier une valeur de distance maximale de la topologie lorsque vous créez votre règle. Cette action permet de rapprocher vos instances de calcul. Toutefois, plus le placement que vous spécifiez est compact, moins il y aura de ressources disponibles dans la zone où vous souhaitez créer vos instances de calcul.
Pour créer une règle de charge de travail pour les instances A4, A3 Ultra, A3 Mega ou A3 High (8 GPU), sélectionnez l'une des options suivantes :
gcloud
Pour créer une règle de charge de travail, utilisez la commande gcloud compute resource-policies create workload-policy. En fonction de la proximité souhaitée entre les instances de calcul d'un MIG, incluez les indicateurs suivants dans la commande :
Pour placer vos instances de calcul à proximité les unes des autres au mieux, incluez le flag
--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGIONPour mieux contrôler l'emplacement de vos instances de calcul, incluez les options
--max-topology-distanceet--type=high-throughput:gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --max-topology-distance=TOPOLOGY_DISTANCE \ --type=high-throughput \ --region=REGION
Remplacez les éléments suivants :
WORKLOAD_POLICY_NAME: nom de votre règle de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines GPU sont disponibles, consultez Régions et zones disponibles.TOPOLOGY_DISTANCE: distance maximale de la topologie. Une distance maximale plus courte peut réduire la probabilité de disponibilité des VM. Spécifiez une des valeurs suivantes :Pour placer des instances A4 ou H4D dans le même cluster :
CLUSTERPour placer des instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D dans le même bloc :
BLOCKPour placer des instances A4, A3 Ultra ou H4D dans le même sous-bloc :
SUBBLOCK
REST
Pour créer une règle de charge de travail, envoyez une requête POST à la méthode resourcePolicies.insert. En fonction de la proximité souhaitée entre les instances de calcul d'un MIG, incluez les champs suivants dans le corps de la requête :
Pour placer vos instances de calcul les unes à côté des autres au mieux, incluez le champ
typedans le corps de la requête :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "type": "HIGH_THROUGHPUT" } }Pour mieux contrôler l'emplacement de vos instances de calcul, incluez les champs
maxTopologyDistanceettypedans le corps de la requête :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME", "workloadPolicy": { "maxTopologyDistance": "TOPOLOGY_DISTANCE", "type": "HIGH_THROUGHPUT" } }
Remplacez les éléments suivants :
PROJECT_ID: ID du projet dans lequel créer votre règle de charge de travail.REGION: région dans laquelle créer votre stratégie de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour connaître les régions dans lesquelles les types de machines GPU sont disponibles, consultez Régions et zones disponibles.WORKLOAD_POLICY_NAME: nom de votre règle de charge de travail.TOPOLOGY_DISTANCE: distance maximale de la topologie. Une distance maximale plus courte peut réduire la probabilité de disponibilité des VM. Spécifiez une des valeurs suivantes :Pour placer des instances A4 ou H4D dans le même cluster :
CLUSTERPour placer des instances A4, A3 Ultra, A3 Mega, A3 High (8 GPU) ou H4D dans le même bloc :
BLOCKPour placer des instances A4, A3 Ultra ou H4D dans le même sous-bloc :
SUBBLOCK
Étapes suivantes
Une fois que vous avez créé une stratégie de charge de travail, découvrez comment l'appliquer à un MIG :
Découvrez comment afficher la topologie d'une instance de calcul.
Découvrez comment afficher les règles de charge de travail.
Découvrez comment remplacer, retirer ou supprimer des stratégies de charge de travail.