Ce document explique comment créer un groupe d'instances géré (MIG) qui utilise des types de machines A4 ou A3 Ultra. Pour en savoir plus sur ces types de machines optimisés pour les accélérateurs, consultez A4 ou A3 Ultra.
La création d'un MIG vous permet de gérer plusieurs machines virtuelles (VM) comme une seule entité. Chaque VM d'un MIG est basée sur un modèle d'instance. En gérant automatiquement les VM du groupe, les MIG offrent une disponibilité et une évolutivité élevées. Pour en savoir plus sur les MIG, consultez Groupes d'instances gérés dans la documentation Compute Engine.
Pour découvrir d'autres méthodes de création de VM ou de clusters, consultez la page Présentation de la création de VM et de clusters.
Limites
Lorsque vous créez un MIG avec des VM A4 ou A3 Ultra, tenez compte des limites pour le type de machine et le MIG.
Limites pour les VM A4 ou A3 Ultra
En fonction de la série de machines utilisée par les VM de votre MIG, les limites suivantes s'appliquent :
A4
- Vous ne bénéficiez ni de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les instances qui utilisent un type de machine A4.
- Vous ne pouvez utiliser un type de machine A4 que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disque persistant (régional ou zonal). Vous ne pouvez utiliser que Google Cloud Hyperdisk.
- Le type de machine A4 n'est disponible que sur la plate-forme de processeur Emerald Rapids.
- Vous ne pouvez pas modifier le type de machine d'une instance en type de machine A4 ni inversement. Vous devez créer une instance avec ce type de machine.
- Les types de machines A4 ne prennent pas en charge la location unique.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A4.
- Pour les instances A4, lorsque vous utilisez
ethtool -Spour surveiller la mise en réseau des GPU, les compteurs de ports physiques se terminant par_phyne sont pas mis à jour. Il s'agit du comportement attendu pour les instances qui utilisent l'architecture de fonction virtuelle (VF) MRDMA. Pour en savoir plus, consultez Fonctions MRDMA et outils de surveillance du réseau. - Vous ne pouvez pas associer les disques Hyperdisk ML créés avant le 4 février 2026 aux types de machines A4.
A3 Ultra
- Vous ne bénéficiez ni de remises automatiques proportionnelles à une utilisation soutenue ni de remises sur engagement d'utilisation flexible pour les instances qui utilisent un type de machine A3 Ultra.
- Vous ne pouvez utiliser un type de machine A3 Ultra que dans certaines régions et zones.
- Vous ne pouvez pas utiliser de disque persistant (régional ou zonal). Vous ne pouvez utiliser que Google Cloud Hyperdisk.
- Le type de machine A3 Ultra n'est disponible que sur la plate-forme de processeur Emerald Rapids.
- Les modifications de type de machine ne sont pas prises en charge pour le type de machine A3 Ultra. Pour passer à ce type de machine ou en changer, vous devez créer une instance.
- Vous ne pouvez pas exécuter de systèmes d'exploitation Windows sur un type de machine A3 Ultra.
- Les types de machines A3 Ultra ne prennent pas en charge la location unique.
- Pour les instances A3 Ultra, lorsque vous utilisez
ethtool -Spour surveiller la mise en réseau des GPU, les compteurs de ports physiques se terminant par_phyne sont pas mis à jour. Il s'agit du comportement attendu pour les instances qui utilisent l'architecture de fonction virtuelle (VF) MRDMA. Pour en savoir plus, consultez Fonctions MRDMA et outils de surveillance du réseau.
Limites du MIG
Lorsque vous créez un MIG avec des VM A4 ou A3 Ultra, les limites suivantes s'appliquent :
Si le modèle d'instance à utiliser pour le MIG spécifie le modèle de provisionnement Démarrage flexible, les limites suivantes s'appliquent :
Vous ne pouvez ajouter des VM au MIG qu'à l'aide de demandes de redimensionnement.
Vous ne pouvez pas appliquer de règle de charge de travail au MIG.
Vous devez désactiver les réparations dans le MIG.
Si vous créez un MIG régional, il ne pourra créer des VM que dans la zone contenant le profil de votre réseau VPC.
Vous ne pouvez pas configurer la flexibilité des instances dans le MIG.
Si vous appliquez une règle de charge de travail à un MIG, vous ne pouvez pas la modifier dans le MIG lorsque le groupe contient des VM. Pour modifier la règle dans un MIG comportant des VM, vous devez d'abord redimensionner le MIG à zéro.
Vous ne pouvez pas utiliser un modèle d'instance qui spécifie une règle d'emplacement pour créer un MIG qui utilise une règle de charge de travail.
Les limites suivantes s'appliquent lorsque vous créez des demandes de redimensionnement de MIG :
Dans un MIG régional, vous ne pouvez utiliser que la forme de distribution cible
ANY_SINGLE_ZONE(bêta). Les autres formes de distribution ne sont pas acceptées.Vous ne pouvez définir le mode de pool de secours du MIG que sur
manual(par défaut).Vous ne pouvez pas définir l'autoscaling.
Si le MIG contient des requêtes de redimensionnement acceptées, vous ne pouvez pas effectuer les opérations suivantes :
Vous ne pouvez pas ajouter de deuxième modèle d'instance pour lancer une mise à jour Canary dans le MIG.
Vous ne pouvez pas modifier la taille cible du MIG.
Vous ne pouvez pas supprimer les instances gérées à l'état
CREATINGcréées par le MIG pour une requête de redimensionnement. Pour supprimer ces instances gérées, vous devez annuler la requête de redimensionnement.
Avant de commencer
Avant de créer un MIG, si vous ne l'avez pas déjà fait, procédez comme suit :
- Choisissez une option de consommation : l'option de consommation que vous choisissez détermine comment vous obtenez et utilisez les ressources GPU.
Pour en savoir plus, consultez Choisir une option de consommation.
- Obtenir de la capacité : le processus d'obtention de la capacité diffère pour chaque option de consommation.
Pour en savoir plus sur la procédure à suivre pour obtenir de la capacité pour l'option de consommation choisie, consultez Présentation de la capacité.
Rôles requis
Pour obtenir les autorisations nécessaires à la création d'un MIG, demandez à votre administrateur de vous attribuer le rôle IAM Administrateur d'instances Compute (v1) (roles/compute.instanceAdmin.v1) sur le projet.
Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
Ce rôle prédéfini contient les autorisations requises pour créer un MIG. Pour connaître les autorisations exactes requises, développez la section Autorisations requises :
Autorisations requises
Les autorisations suivantes sont requises pour créer un MIG :
-
Pour créer un MIG :
compute.instanceGroupManagers.createsur le projet
Vous pouvez également obtenir ces autorisations avec des rôles personnalisés ou d'autres rôles prédéfinis.
Présentation
La création d'un MIG avec le type de machine A4 ou A3 Ultra comprend les étapes suivantes :
- Créer des réseaux VPC
- Facultatif : créez une règle de charge de travail.
- Créer un modèle d'instance
- Créer un MIG
Créer des réseaux VPC
Pour configurer le réseau pour le type de machine A4 ou A3 Ultra, créez trois réseaux VPC pour les interfaces réseau suivantes :
- Deux réseaux VPC standards pour les interfaces réseau gVNIC. Celles-ci sont utilisées pour la communication d'hôte à hôte.
- Un réseau VPC avec le profil réseau RoCE est requis pour les cartes d'interface réseau CX-7. Le réseau VPC RoCE doit comporter huit sous-réseaux, un pour chaque carte d'interface réseau CX-7. Ces cartes réseau utilisent RDMA over Converged Ethernet (RoCE), qui fournit la communication à bande passante élevée et à faible latence essentielle pour la communication entre GPU.
Pour en savoir plus sur la configuration des cartes d'interface réseau, consultez Examiner la bande passante réseau et la configuration des cartes d'interface réseau.
Créez les réseaux manuellement en suivant les guides d'instructions ou automatiquement à l'aide du script fourni.
Guides d'instructions
Pour créer les réseaux, vous pouvez suivre les instructions suivantes :
- Pour créer les réseaux VPC standards pour les gVNIC, consultez Créer et gérer des réseaux de cloud privé virtuel.
- Pour créer le réseau VPC RoCE, consultez Créer un réseau de cloud privé virtuel pour les cartes d'interface réseau RDMA.
Pour ces réseaux VPC, nous vous recommandons de définir l'unité de transmission maximale (MTU) sur une valeur plus élevée.
Pour les types de machines A4 ou A3 Ultra, la MTU recommandée est de 8896 octets.
Pour connaître les paramètres MTU recommandés pour les autres types de machines GPU, consultez Paramètres MTU pour les types de machines GPU.
Script
Pour créer les réseaux, procédez comme suit.
Pour ces réseaux VPC, nous vous recommandons de définir l'unité de transmission maximale (MTU) sur une valeur plus élevée.
Pour les types de machines A4 ou A3 Ultra, la MTU recommandée est de 8896 octets.
Pour connaître les paramètres MTU recommandés pour les autres types de machines GPU, consultez Paramètres MTU pour les types de machines GPU.
Utilisez le script suivant pour créer des réseaux VPC pour les cartes réseau gVNIC et CX-7.
#!/bin/bash # Create regular VPC networks and subnets for the gVNICs for N in $(seq 0 1); do gcloud compute networks create GVNIC_NAME_PREFIX-net-$N \ --subnet-mode=custom \ --mtu=8896 gcloud compute networks subnets create GVNIC_NAME_PREFIX-sub-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --region=REGION \ --range=10.$N.0.0/16 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-internal-$N \ --network=GVNIC_NAME_PREFIX-net-$N \ --action=ALLOW \ --rules=tcp:0-65535,udp:0-65535,icmp \ --source-ranges=10.0.0.0/8 done # Create SSH firewall rules gcloud compute firewall-rules create GVNIC_NAME_PREFIX-ssh \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=tcp:22 \ --source-ranges=IP_RANGE # Assumes that an external IP is only created for vNIC 0 gcloud compute firewall-rules create GVNIC_NAME_PREFIX-allow-ping-net-0 \ --network=GVNIC_NAME_PREFIX-net-0 \ --action=ALLOW \ --rules=icmp \ --source-ranges=IP_RANGE # List and make sure network profiles exist in the machine type's zone gcloud compute network-profiles list --filter "location.name=ZONE" # Create network for CX-7 gcloud compute networks create RDMA_NAME_PREFIX-mrdma \ --network-profile=ZONE-vpc-roce \ --subnet-mode custom \ --mtu=8896 # Create subnets for N in $(seq 0 7); do gcloud compute networks subnets create RDMA_NAME_PREFIX-mrdma-sub-$N \ --network=RDMA_NAME_PREFIX-mrdma \ --region=REGION \ --range=10.$((N+2)).0.0/16 # offset to avoid overlap with gVNICs doneRemplacez les éléments suivants :
GVNIC_NAME_PREFIX: préfixe de nom personnalisé à utiliser pour les réseaux et sous-réseaux VPC standards des cartes gVNIC.RDMA_NAME_PREFIX: préfixe de nom personnalisé à utiliser pour le réseau et les sous-réseaux VPC RoCE pour les cartes réseau CX-7.ZONE: spécifiez une zone dans laquelle le type de machine que vous souhaitez utiliser est disponible, par exempleus-central1-a. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.REGION: région dans laquelle vous souhaitez créer des sous-réseaux. Cette région doit correspondre à la zone spécifiée. Par exemple, si votre zone estus-central1-a, votre région estus-central1.IP_RANGE: plage d'adresses IP à utiliser pour les règles de pare-feu SSH.
- Facultatif : Pour vérifier que les ressources du réseau VPC ont bien été créées, vérifiez les paramètres réseau dans la console Google Cloud :
- Dans la console Google Cloud , accédez à la page Réseaux VPC.
- Recherchez dans la liste les réseaux que vous avez créés à l'étape précédente.
- Pour afficher les sous-réseaux, les règles de pare-feu et les autres paramètres réseau, cliquez sur le nom du réseau.
Facultatif : Créer une règle de charge de travail
Pour l'option de consommation à démarrage flexible, ignorez cette section et passez à la création d'un modèle d'instance. En raison de limitations, le modèle de provisionnement de démarrage Flex n'est pas compatible avec les règles de charge de travail.Vous pouvez spécifier l'emplacement des VM en créant une règle de charge de travail. Si vous disposez déjà d'un règlement sur les charges de travail, vous pouvez le réutiliser. Lorsque vous appliquez une règle de charge de travail à votre MIG, Compute Engine s'efforce de créer des VM aussi proches les unes des autres que possible. Si votre application est sensible à la latence et que vous souhaitez que les VM soient plus proches les unes des autres (compacité maximale), spécifiez le champ maxTopologyDistance lorsque vous créez une stratégie de charge de travail.
Vous ne pouvez pas modifier une règle de charge de travail après l'avoir créée. Pour apporter des modifications à une règle de charge de travail, vous devez en créer une.
Pour créer une stratégie de charge de travail, sélectionnez l'une des options suivantes :
gcloud
Pour créer une règle de charge de travail, utilisez la
commande gcloud compute resource-policies create workload-policy.
-
Pour un placement des VM au mieux, spécifiez uniquement l'indicateur
--type=high-throughputdans la commande :gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --region=REGION -
Pour une colocation stricte des VM, spécifiez l'option
--max-topology-distancedans la commande :gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \ --type=high-throughput \ --max-topology-distance=TOPOLOGY_DISTANCE \ --region=REGION
Remplacez les éléments suivants :
WORKLOAD_POLICY_NAME: nom de la règle de charge de travail.TOPOLOGY_DISTANCE: distance maximale de la topologie. Spécifiez l'une des valeurs suivantes :- Pour placer les VM dans le même cluster :
CLUSTER - Pour placer les VM dans le même bloc :
BLOCK - Pour placer des VM dans le même sous-bloc :
SUBBLOCK
Remarque : Une distance maximale plus courte peut réduire la probabilité de disponibilité des VM.- Pour placer les VM dans le même cluster :
REGION: région dans laquelle vous souhaitez créer la règle de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et où le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.
REST
Pour créer une règle de charge de travail, envoyez une requête POST à la méthode resourcePolicies.insert.
-
Pour un placement des VM au mieux, spécifiez uniquement le champ
typedans la requête comme suit :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT" } } -
Pour une colocation stricte des VM, spécifiez le champ
maxTopologyDistancedans la requête comme suit :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/resourcePolicies { "name": "WORKLOAD_POLICY_NAME" "workloadPolicy": { "type": "HIGH_THROUGHPUT", "maxTopologyDistance": "TOPOLOGY_DISTANCE" } }
Remplacez les éléments suivants :
PROJECT_ID: ID de votre projetREGION: région dans laquelle vous souhaitez créer la règle de charge de travail. Spécifiez une région dans laquelle vous souhaitez créer le MIG et le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.WORKLOAD_POLICY_NAME: nom de la règle de charge de travail.TOPOLOGY_DISTANCE: distance maximale de la topologie. Spécifiez l'une des valeurs suivantes :- Pour placer les VM dans le même bloc :
BLOCK - Pour placer les VM dans le même cluster :
CLUSTER
Remarque : Une distance maximale plus courte peut réduire la probabilité de disponibilité des VM.- Pour placer les VM dans le même bloc :
Créer un modèle d'instance
Spécifiez les propriétés de VM pour un MIG en créant un modèle d'instance.
Pour créer un modèle d'instance, sélectionnez l'une des options suivantes.
Les commandes suivantes définissent également le niveau d'accès pour vos instances. Pour simplifier la gestion des autorisations, Google vous recommande de définir le niveau d'accès d'une instance surcloud-platform, puis d'utiliser des rôles IAM pour définir les services auxquels l'instance peut accéder. Pour en savoir plus, consultez les bonnes pratiques concernant les niveaux d'accès.
gcloud
Les paramètres que vous devez spécifier dépendent de l'option de consommation que vous utilisez pour ce déploiement. Sélectionnez l'onglet correspondant au modèle de provisionnement de votre option de consommation.
Démarrage flexible
Pour créer un modèle d'instance régional, exécutez la commande gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--reservation-affinity=none \
--instance-termination-action=DELETE \
--max-run-duration=RUN_DURATION \
--maintenance-policy=TERMINATE \
--provisioning-model=FLEX_START
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME: nom du modèle d'instance.MACHINE_TYPE: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY: famille d'images à laquelle appartient l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez la page Systèmes d'exploitation compatibles.IMAGE_PROJECT: ID du projet de l'image de l'OS.REGION: région dans laquelle vous souhaitez créer le modèle d'instance. Spécifiez une région dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.DISK_SIZE: taille du disque de démarrage en Go.GVNIC_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes d'interface réseau gVNIC.RDMA_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.RUN_DURATION: durée d'exécution des VM demandées. Vous devez formater la valeur en nombre de jours, d'heures, de minutes ou de secondes, suivis respectivement ded,h,mets. Par exemple, spécifiez30mpour 30 minutes ou1d2h3m4spour un jour, deux heures, trois minutes et quatre secondes. Cette valeur doit être comprise entre 10 minutes et 7 jours.
Lié à la réservation
Pour créer un modèle d'instance régional, exécutez la commande gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--reservation-affinity=specific \
--reservation=RESERVATION \
--provisioning-model=RESERVATION_BOUND \
--instance-termination-action=DELETE \
--maintenance-policy=TERMINATE \
--restart-on-failure
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME: nom du modèle d'instance.MACHINE_TYPE: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY: famille d'images à laquelle appartient l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez la page Systèmes d'exploitation compatibles.IMAGE_PROJECT: ID du projet de l'image de l'OS.REGION: région dans laquelle vous souhaitez créer le modèle d'instance. Spécifiez une région dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.DISK_SIZE: taille du disque de démarrage en Go.GVNIC_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes d'interface réseau gVNIC.RDMA_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.-
RESERVATION: nom de la réservation ou d'un bloc spécifique dans une réservation. Pour obtenir le nom de la réservation ou les blocs disponibles, consultez Afficher la capacité réservée. En fonction de vos exigences concernant l'emplacement des instances, choisissez l'une des options suivantes :Pour créer des instances sur plusieurs blocs ou sur un seul bloc :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
De plus, pour un seul bloc, créez le MIG en appliquant une règle de charge de travail qui spécifie une colocation de bloc (
maxTopologyDistance=BLOCK). Compute Engine applique ensuite la règle à la réservation et crée des instances sur le même bloc.Pour créer des instances sur un bloc spécifique :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Pour créer un modèle d'instance régional, exécutez la commande gcloud compute instance-templates create.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT \
--instance-template-region=REGION \
--boot-disk-type=hyperdisk-balanced \
--boot-disk-size=DISK_SIZE \
--scopes=cloud-platform \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-0,subnet=GVNIC_NAME_PREFIX-sub-0 \
--network-interface=nic-type=GVNIC,network=GVNIC_NAME_PREFIX-net-1,subnet=GVNIC_NAME_PREFIX-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-0,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-1,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-2,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-3,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-4,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-5,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-6,no-address \
--network-interface=nic-type=MRDMA,network=RDMA_NAME_PREFIX-mrdma,subnet=RDMA_NAME_PREFIX-mrdma-sub-7,no-address \
--provisioning-model=SPOT \
--instance-termination-action=TERMINATION_ACTION \
--maintenance-policy=TERMINATE \
--no-restart-on-failure
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME: nom du modèle d'instance.MACHINE_TYPE: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY: famille d'images à laquelle appartient l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez la page Systèmes d'exploitation compatibles.IMAGE_PROJECT: ID du projet de l'image de l'OS.REGION: région dans laquelle vous souhaitez créer le modèle d'instance. Spécifiez une région dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.DISK_SIZE: taille du disque de démarrage en Go.GVNIC_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes d'interface réseau gVNIC.RDMA_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.TERMINATION_ACTION: action à effectuer lorsque Compute Engine préempte l'instance, soitSTOP(par défaut), soitDELETE.
REST
Les paramètres que vous devez spécifier dépendent de l'option de consommation que vous utilisez pour ce déploiement. Sélectionnez l'onglet correspondant au modèle de provisionnement de votre option de consommation.
Démarrage flexible
Pour créer un modèle d'instance régional, envoyez une requête POST à la méthode regionInstanceTemplates.insert :
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"reservationAffinity": {
"consumeReservationType": "NO_RESERVATION"
},
"scheduling": {
"instanceTerminationAction": "DELETE",
"maxRunDuration": {
"seconds": RUN_DURATION
},
"onHostMaintenance": "TERMINATE",
"provisioningModel": "FLEX_START"
}
}
}
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME: nom du modèle d'instance.MACHINE_TYPE: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY: famille d'images à laquelle appartient l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez la page Systèmes d'exploitation compatibles.IMAGE_PROJECT: ID du projet de l'image de l'OS.REGION: région dans laquelle vous souhaitez créer le modèle d'instance. Spécifiez une région dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.DISK_SIZE: taille du disque de démarrage en Go.NETWORK_PROJECT_ID: ID du projet du réseau.GVNIC_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes d'interface réseau gVNIC.REGION: région du sous-réseau.RDMA_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.RUN_DURATION: durée, en secondes, pendant laquelle vous souhaitez que les VM demandées s'exécutent. La valeur doit être comprise entre600, soit 600 secondes (10 minutes), et604800, soit 604 800 secondes (7 jours).
Lié à la réservation
Pour créer un modèle d'instance régional, envoyez une requête POST à la méthode regionInstanceTemplates.insert :
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"reservationAffinity":{
"consumeReservationType":"SPECIFIC_RESERVATION",
"key":"compute.googleapis.com/reservation-name",
"values":[
"RESERVATION"
]
},
"scheduling":{
"provisioningModel":"RESERVATION_BOUND",
"instanceTerminationAction":"DELETE",
"onHostMaintenance": "TERMINATE",
"automaticRestart":true
}
}
}
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME: nom du modèle d'instance.MACHINE_TYPE: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY: famille d'images à laquelle appartient l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez la page Systèmes d'exploitation compatibles.IMAGE_PROJECT: ID du projet de l'image de l'OS.REGION: région dans laquelle vous souhaitez créer le modèle d'instance. Spécifiez une région dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.DISK_SIZE: taille du disque de démarrage en Go.NETWORK_PROJECT_ID: ID du projet du réseau.GVNIC_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes d'interface réseau gVNIC.REGION: région du sous-réseau.RDMA_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.-
RESERVATION: nom de la réservation ou d'un bloc spécifique dans une réservation. Pour obtenir le nom de la réservation ou les blocs disponibles, consultez Afficher la capacité réservée. En fonction de vos exigences concernant l'emplacement des instances, choisissez l'une des options suivantes :Pour créer des instances sur plusieurs blocs ou sur un seul bloc :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME
De plus, pour un seul bloc, créez le MIG en appliquant une règle de charge de travail qui spécifie une colocation de bloc (
maxTopologyDistance=BLOCK). Compute Engine applique ensuite la règle à la réservation et crée des instances sur le même bloc.Pour créer des instances sur un bloc spécifique :
projects/RESERVATION_OWNER_PROJECT_ID/reservations/RESERVATION_NAME/reservationBlocks/RESERVATION_BLOCK_NAME
Spot
Pour créer un modèle d'instance régional, envoyez une requête POST à la méthode regionInstanceTemplates.insert :
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceTemplates
{
"name":"INSTANCE_TEMPLATE_NAME",
"properties":{
"machineType":"MACHINE_TYPE",
"disks":[
{
"boot":true,
"initializeParams":{
"diskSizeGb":"DISK_SIZE",
"diskType":"hyperdisk-balanced",
"sourceImage":"projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
},
"mode":"READ_WRITE",
"type":"PERSISTENT"
}
],
"serviceAccounts": [
{
"email": "default",
"scopes": [
"https://www.googleapis.com/auth/cloud-platform"
]
}
],
"networkInterfaces": [
{
"accessConfigs": [
{
"name": "external-nat",
"type": "ONE_TO_ONE_NAT"
}
],
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-0",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/GVNIC_NAME_PREFIX-net-1",
"nicType": "GVNIC",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/GVNIC_NAME_PREFIX-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-0"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-1"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-2"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-3"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-4"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-5"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-6"
},
{
"network": "projects/NETWORK_PROJECT_ID/global/networks/RDMA_NAME_PREFIX-mrdma",
"nicType": "MRDMA",
"subnetwork": "projects/NETWORK_PROJECT_ID/region/REGION/subnetworks/RDMA_NAME_PREFIX-mrdma-sub-7"
}
],
"scheduling":
{
"provisioningModel": "SPOT",
"instanceTerminationAction": "TERMINATION_ACTION",
"onHostMaintenance": "TERMINATE",
"automaticRestart": false
}
}
}
Remplacez les éléments suivants :
INSTANCE_TEMPLATE_NAME: nom du modèle d'instance.MACHINE_TYPE: type de machine à utiliser pour la VM. Spécifiez un type de machine A4 ou A3 Ultra. Pour en savoir plus, consultez Types de machines GPU.IMAGE_FAMILY: famille d'images à laquelle appartient l'image de l'OS que vous souhaitez utiliser. Pour obtenir la liste des systèmes d'exploitation compatibles, consultez la page Systèmes d'exploitation compatibles.IMAGE_PROJECT: ID du projet de l'image de l'OS.REGION: région dans laquelle vous souhaitez créer le modèle d'instance. Spécifiez une région dans laquelle le type de machine que vous souhaitez utiliser est disponible. Pour en savoir plus sur les régions, consultez Disponibilité des GPU par région et par zone.DISK_SIZE: taille du disque de démarrage en Go.NETWORK_PROJECT_ID: ID du projet du réseau.GVNIC_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC standards qui utilisent des cartes d'interface réseau gVNIC.REGION: région du sous-réseau.RDMA_NAME_PREFIX: préfixe de nom que vous avez spécifié lors de la création des réseaux et sous-réseaux VPC qui utilisent des cartes d'interface réseau RDMA.TERMINATION_ACTION: action à effectuer lorsque Compute Engine préempte l'instance, soitSTOP(par défaut), soitDELETE.
Une fois créé, vous pouvez consulter le modèle d'instance pour voir son ID et examiner les propriétés de l'instance.
Créer un MIG
Après avoir terminé toutes les étapes précédentes, créez un MIG en fonction de votre scénario :
| Scénario | Méthode pour créer un MIG et des VM | Exemple |
|---|---|---|
| Vous disposez de plusieurs jobs ou de jobs parallèles pouvant démarrer avec n'importe quel nombre de VM. | Créez un MIG et utilisez la taille cible pour spécifier le nombre de VM que vous souhaitez inclure dans le groupe. Consultez Créer un MIG avec une taille cible. |
Jobs d'inférence ML |
| Vous avez un job qui nécessite une distribution sur un nombre exact de VM. | Créez un MIG sans VM, puis créez une demande de redimensionnement dans le MIG.
La requête de redimensionnement vous permet d'obtenir des VM simultanément. |
Jobs d'entraînement et d'affinage de ML distribués |
Créer un MIG avec une taille cible
Si vous pouvez démarrer votre job sans créer toutes les VM en même temps, créez un MIG avec une taille cible. La taille cible détermine le nombre de VM dans le MIG. Le MIG commence à créer des VM en fonction de la disponibilité actuelle des ressources. Si une ressource est temporairement indisponible, le MIG tente continuellement de créer des VM pour atteindre la taille cible.
Pour créer un MIG avec une taille cible, sélectionnez l'une des options suivantes :
gcloud
Pour créer un MIG avec une taille cible spécifiée, utilisez la commande instance-groups managed
create.
Les commandes permettant de créer un MIG utilisent une règle de charge de travail pour spécifier l'emplacement des VM. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le flag --workload-policy.
Créez un MIG zonal ou régional comme suit :
- Pour créer un MIG zonal, utilisez la commande suivante :
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE
- Pour créer un MIG régional, utilisez la commande suivante :
gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=TARGET_SIZE \ --workload-policy=WORKLOAD_POLICY_URL \ --region=REGION
MIG_NAME: nom du MIG.INSTANCE_TEMPLATE_URL: URL du modèle d'instance que vous souhaitez utiliser pour créer des VM dans le MIG. L'URL peut contenir l'ID ou le nom du modèle d'instance. Spécifiez une des valeurs suivantes :- Pour un modèle d'instance régional :
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Pour un modèle d'instance global :
INSTANCE_TEMPLATE_ID
- Pour un modèle d'instance régional :
TARGET_SIZE: nombre de VM que vous souhaitez inclure dans le MIG.WORKLOAD_POLICY_URL: URL de la règle de charge de travail (facultatif). Exemple :projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Si vous ne souhaitez pas utiliser de règle de charge de travail, vous pouvez supprimer l'indicateur--workload-policy.ZONE: zone dans laquelle vous souhaitez créer le MIG. Si vous utilisez une règle de charge de travail, spécifiez une zone dans la région de la règle.REGION: région dans laquelle vous souhaitez créer le MIG. Si vous utilisez une règle de charge de travail, spécifiez la même région que celle de la règle. Pour un MIG régional, vous pouvez spécifier les zones de cette région au lieu de la région elle-même en utilisant l'indicateur--zones.
REST
Pour créer un MIG avec une taille cible spécifiée, envoyez une requête POST.
Les requêtes de création d'un MIG utilisent une stratégie de charge de travail pour spécifier l'emplacement des VM. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le champ resourcePolicies.workloadPolicy.
Créez un MIG zonal ou régional comme suit :
- Pour créer un MIG zonal, envoyez une requête
POSTà la méthodeinstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Pour créer un MIG régional, envoyez une requête
POSTà la méthoderegionInstanceGroupManagers.insert.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "instanceTemplate": "INSTANCE_TEMPLATE_URL", "targetSize": "TARGET_SIZE", "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } }
PROJECT_ID: ID du projet.ZONE: zone dans laquelle vous souhaitez créer le MIG. Si vous utilisez une règle de charge de travail, spécifiez une zone dans la région de la règle.REGION: région dans laquelle vous souhaitez créer le MIG. Si vous utilisez une règle de charge de travail, spécifiez la même région que celle de la règle.INSTANCE_TEMPLATE_URL: URL du modèle d'instance que vous souhaitez utiliser pour créer des VM dans le MIG. L'URL peut contenir l'ID ou le nom du modèle d'instance. Spécifiez une des valeurs suivantes :- Pour un modèle d'instance régional :
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Pour un modèle d'instance global :
INSTANCE_TEMPLATE_ID
- Pour un modèle d'instance régional :
MIG_NAME: nom du MIG.TARGET_SIZE: nombre de VM que vous souhaitez inclure dans le MIG.WORKLOAD_POLICY_URL: URL de la règle de charge de travail (facultatif). Par exemple :projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le champresourcePolicies.workloadPolicy.
Créer un MIG et une demande de redimensionnement
Si vous avez besoin de plusieurs VM en même temps pour démarrer un job, créez un MIG, puis créez une demande de redimensionnement dans le MIG, comme décrit dans cette section.Pour créer une demande de redimensionnement dans un MIG, sélectionnez l'une des options suivantes.
gcloud
Les paramètres que vous devez spécifier dépendent de l'option de consommation que vous utilisez pour ce déploiement. Sélectionnez l'onglet correspondant au modèle de provisionnement de votre option de consommation.
Démarrage flexible
Pour créer un MIG zonal ou régional et une demande de redimensionnement :
-
Pour créer un MIG zonal et une demande de redimensionnement dans celui-ci :
-
Créez un MIG zonal à l'aide de la commande
instance-groups managed createcomme suit.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zone=ZONE -
Créez une demande de redimensionnement dans le MIG zonal à l'aide de la commande
instance-groups managed resize-requests createcomme suit :gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
Pour créer un MIG régional et une demande de redimensionnement dans celui-ci :
-
Créez un MIG régional à l'aide de la commande
instance-groups managed createcomme suit.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --default-action-on-vm-failure=do-nothing \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Créez une demande de redimensionnement dans le MIG régional à l'aide de la commande bêta
instance-groups managed resize-requests createcomme suit :gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Lié à la réservation
Les commandes permettant de créer un MIG utilisent une règle de charge de travail pour spécifier l'emplacement des VM. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le flag --workload-policy.
Pour créer un MIG zonal ou régional et une demande de redimensionnement :
-
Pour créer un MIG zonal et une demande de redimensionnement dans celui-ci :
-
Créez un MIG zonal à l'aide de la commande
instance-groups managed createcomme suit.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Créez une demande de redimensionnement dans le MIG zonal à l'aide de la commande
instance-groups managed resize-requests createcomme suit :gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
Pour créer un MIG régional et une demande de redimensionnement dans celui-ci :
-
Créez un MIG régional à l'aide de la commande
instance-groups managed createcomme suit.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Créez une demande de redimensionnement dans le MIG régional à l'aide de la commande bêta
instance-groups managed resize-requests createcomme suit :gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
Spot
Les commandes permettant de créer un MIG utilisent une règle de charge de travail pour spécifier l'emplacement des VM. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le flag --workload-policy.
Pour créer un MIG zonal ou régional et une demande de redimensionnement :
-
Pour créer un MIG zonal et une demande de redimensionnement dans celui-ci :
-
Créez un MIG zonal à l'aide de la commande
instance-groups managed createcomme suit.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zone=ZONE -
Créez une demande de redimensionnement dans le MIG zonal à l'aide de la commande
instance-groups managed resize-requests createcomme suit :gcloud compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --zone=ZONE
-
-
Pour créer un MIG régional et une demande de redimensionnement dans celui-ci :
-
Créez un MIG régional à l'aide de la commande
instance-groups managed createcomme suit.gcloud compute instance-groups managed create MIG_NAME \ --template=INSTANCE_TEMPLATE_URL \ --size=0 \ --workload-policy=WORKLOAD_POLICY_URL \ --zones=ZONE \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none -
Créez une demande de redimensionnement dans le MIG régional à l'aide de la commande bêta
instance-groups managed resize-requests createcomme suit :gcloud beta compute instance-groups managed resize-requests create MIG_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --region=REGION
-
MIG_NAME: nom du MIG.INSTANCE_TEMPLATE_URL: URL du modèle d'instance que vous souhaitez utiliser pour créer des VM dans le MIG. L'URL peut contenir l'ID ou le nom du modèle d'instance. Spécifiez une des valeurs suivantes :- Pour un modèle d'instance régional :
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Pour un modèle d'instance global :
INSTANCE_TEMPLATE_ID
- Pour un modèle d'instance régional :
WORKLOAD_POLICY_URL: URL de la règle de charge de travail (facultatif). Par exemple :projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez l'indicateur--workload-policy.ZONE: zone dans laquelle vous souhaitez créer le MIG. Pour un MIG régional, vous devez également spécifier une zone. Cette zone doit être celle qui contient le profil de votre réseau VPC et doit être une zone où le type de machine est disponible. Pour en savoir plus, consultez la section Limites.RESIZE_REQUEST_NAME: nom de la requête de redimensionnement, qui doit être unique dans le MIG spécifié. Sinon, la création de la demande de redimensionnement échoue.COUNT: nombre de VM à ajouter simultanément au MIG.REGION: région dans laquelle se trouve le MIG.
Si votre charge de travail nécessite des noms de VM spécifiques, vous pouvez spécifier une liste de noms de VM à créer à l'aide de la commande beta instance-groups managed resize-requests create.
Dans la commande, remplacez l'indicateur --resize-request par l'indicateur --instances.
REST
Les paramètres que vous devez spécifier dépendent de l'option de consommation que vous utilisez pour ce déploiement. Sélectionnez l'onglet correspondant au modèle de provisionnement de votre option de consommation.
Démarrage flexible
Pour créer un MIG zonal ou régional et une demande de redimensionnement :
- Pour créer un MIG zonal et une demande de redimensionnement dans celui-ci, procédez comme suit :
- Créez un MIG zonal en envoyant une requête
POSTà la méthodeinstanceGroupManagers.insertcomme suit.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Créez une demande de redimensionnement dans le MIG zonal en envoyant une requête
POSTà la méthodeinstanceGroupManagerResizeRequests.insertcomme suit :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Créez un MIG zonal en envoyant une requête
- Pour créer un MIG régional et une demande de redimensionnement dans celui-ci :
- Créez un MIG régional en envoyant une requête
POSTà la méthoderegionInstanceGroupManagers.insertcomme suit.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } } - Créez une demande de redimensionnement dans le MIG régional en envoyant une requête
POSTà la méthodebeta.regionInstanceGroupManagerResizeRequests.insertcomme suit :POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Créez un MIG régional en envoyant une requête
Lié à la réservation
Les requêtes de création d'un MIG utilisent une stratégie de charge de travail pour spécifier l'emplacement des VM. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le champ resourcePolicies.workloadPolicy.
Pour créer un MIG zonal ou régional et une demande de redimensionnement :
- Pour créer un MIG zonal et une demande de redimensionnement dans celui-ci, procédez comme suit :
- Créez un MIG zonal en envoyant une requête
POSTà la méthodeinstanceGroupManagers.insertcomme suit.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Créez une demande de redimensionnement dans le MIG zonal en envoyant une requête
POSTà la méthodeinstanceGroupManagerResizeRequests.insertcomme suit :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Créez un MIG zonal en envoyant une requête
- Pour créer un MIG régional et une demande de redimensionnement dans celui-ci :
- Créez un MIG régional en envoyant une requête
POSTà la méthoderegionInstanceGroupManagers.insertcomme suit.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Créez une demande de redimensionnement dans le MIG régional en envoyant une requête
POSTà la méthodebeta.regionInstanceGroupManagerResizeRequests.insertcomme suit :POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Créez un MIG régional en envoyant une requête
Spot
Les requêtes de création d'un MIG utilisent une stratégie de charge de travail pour spécifier l'emplacement des VM. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le champ resourcePolicies.workloadPolicy.
Pour créer un MIG zonal ou régional et une demande de redimensionnement :
- Pour créer un MIG zonal et une demande de redimensionnement dans celui-ci, procédez comme suit :
- Créez un MIG zonal en envoyant une requête
POSTà la méthodeinstanceGroupManagers.insertcomme suit.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Créez une demande de redimensionnement dans le MIG zonal en envoyant une requête
POSTà la méthodeinstanceGroupManagerResizeRequests.insertcomme suit :POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Créez un MIG zonal en envoyant une requête
- Pour créer un MIG régional et une demande de redimensionnement dans celui-ci :
- Créez un MIG régional en envoyant une requête
POSTà la méthoderegionInstanceGroupManagers.insertcomme suit.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers { "versions": [ { "instanceTemplate": "INSTANCE_TEMPLATE_URL" } ], "name": "MIG_NAME", "targetSize": 0, "distributionPolicy": { "targetShape": "ANY_SINGLE_ZONE", "zones": [ { "zone": "projects/PROJECT_ID/zones/ZONE" } ] }, "updatePolicy": { "instanceRedistributionType": "NONE" }, "resourcePolicies": { "workloadPolicy": WORKLOAD_POLICY_URL } } - Créez une demande de redimensionnement dans le MIG régional en envoyant une requête
POSTà la méthodebeta.regionInstanceGroupManagerResizeRequests.insertcomme suit :POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT }
- Créez un MIG régional en envoyant une requête
PROJECT_ID: ID du projet.ZONE: zone dans laquelle vous souhaitez créer le MIG. Pour un MIG régional, vous devez également spécifier une zone. Cette zone doit être celle qui contient le profil de votre réseau VPC et doit être une zone où le type de machine est disponible. Pour en savoir plus, consultez la section Limites.REGION: région dans laquelle vous souhaitez créer le MIG.INSTANCE_TEMPLATE_URL: URL du modèle d'instance que vous souhaitez utiliser pour créer des VM dans le MIG. L'URL peut contenir l'ID ou le nom du modèle d'instance. Spécifiez une des valeurs suivantes :- Pour un modèle d'instance régional :
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Pour un modèle d'instance global :
INSTANCE_TEMPLATE_ID
- Pour un modèle d'instance régional :
MIG_NAME: nom du MIG.WORKLOAD_POLICY_URL: URL de la règle de charge de travail (facultatif). Par exemple :projects/example-project/regions/us-central1/resourcePolicies/example-workload-policy. Si vous ne souhaitez pas utiliser de règle de charge de travail, supprimez le champresourcePolicies.workloadPolicy.RESIZE_REQUEST_NAME: nom de la requête de redimensionnement, qui doit être unique dans le MIG spécifié. Sinon, la création de la demande de redimensionnement échoue.COUNT: nombre de VM à ajouter simultanément au MIG.
Si votre charge de travail nécessite des noms de VM spécifiques, vous pouvez spécifier une liste de noms de VM à créer. Pour ce faire, envoyez une requête POST à la méthode beta.regionInstanceGroupManagerResizeRequests.insert pour un MIG régional ou à la méthode beta.instanceGroupManagerResizeRequests.insert pour un MIG zonal. Dans le corps de la requête, remplacez le champ resizeBy par le champ instanceNames.
Étape suivante
- Vérifier la consommation des réservations
- Afficher la topologie d'une instance de calcul
- Surveiller les VM
- Signaler un hôte défectueux
- Afficher, annuler ou supprimer des requêtes de redimensionnement
- Résoudre les problèmes de consommation de réservations