Ce document explique comment créer un groupe d'instances géré (MIG) qui forme un slice TPU multihôte.
Avant de commencer
- Consultez les limites pour la création de MIG avec des instances TPU.
-
Si ce n'est pas déjà fait, configurez l'authentification.
L'authentification permet de valider votre identité pour accéder aux services et aux API Google Cloud . Pour exécuter du code ou des exemples depuis un environnement de développement local, vous pouvez vous authentifier auprès de Compute Engine en sélectionnant l'une des options suivantes :
-
Installez la Google Cloud CLI. Une fois que la Google Cloud CLI est installée, initialisez-la en exécutant la commande suivante :
gcloud initSi vous utilisez un fournisseur d'identité (IdP) externe, vous devez d'abord vous connecter à la gcloud CLI avec votre identité fédérée.
- Définissez une région et une zone par défaut.
-
Prérequis
Avant de créer une tranche TPU multi-hôte, vous devez effectuer les opérations suivantes :
Choisissez la version de TPU : sélectionnez la version de TPU adaptée à votre charge de travail. Pour obtenir la liste des versions de TPU par type de charge de travail, consultez Versions de TPU recommandées par type de charge de travail.
Vérifiez la disponibilité des TPU dans la région de votre choix : les TPU sont disponibles dans des régions Google Cloud spécifiques. Pour utiliser une version de TPU, assurez-vous qu'elle est disponible dans la région de votre choix. Pour obtenir la liste des emplacements des TPU, consultez Disponibilité des TPU.
Assurez-vous que votre projet dispose d'un quota TPU suffisant : si vous créez une tranche TPU multi-hôte avec des VM à la demande ou Spot, vous devez disposer d'un quota TPU suffisant dans la région que vous souhaitez utiliser. La création d'une tranche TPU multi-hôte qui consomme une réservation TPU ne nécessite aucun quota TPU, car le quota a été utilisé lors de la création de la réservation. Pour obtenir la liste des noms de quotas de TPU, consultez Quotas de TPU. Pour savoir comment afficher les quotas, consultez Afficher et gérer les quotas.
Choisissez une option de consommation de TPU : sélectionnez l'option de consommation qui correspond le mieux à votre charge de travail, à sa durée et à vos besoins en termes de coûts. Pour obtenir la liste des options de consommation disponibles par version de TPU, consultez Options de consommation de TPU.
Choisissez une topologie : sélectionnez une topologie compatible avec la version de TPU choisie. Pour obtenir la liste des topologies disponibles pour chaque version de TPU, consultez Topologie des TPU.
Créer un MIG avec des tranches TPU multi-hôtes
- Créer un modèle d'instance.
- Créez une règle de charge de travail.
- Créez le MIG.
Créer un modèle d'instance
La commande permettant de créer un modèle d'instance dépend de l'option de consommation que vous utilisez : à la demande, Spot, liée à une réservation ou à démarrage flexible. Pour en savoir plus sur les options d'utilisation, consultez À propos des modèles de provisionnement de VM.
Créer un modèle d'instance pour une VM TPU à la demande
La commande suivante crée un modèle d'instance à l'aide de l'option de consommation à la demande :
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Remplacez les espaces réservés suivants :
INSTANCE_TEMPLATE_NAME: nom de votre modèle d'instance.MACHINE_TYPE: type de machine pour la VM TPU, par exemplect6e-standard-8t.IMAGE_FAMILY: famille d'images d'OS pour la VM TPU. Si vous souhaitez installer une version spécifique de l'OS, utilisez l'option--image. Pour en savoir plus sur les images d'OS, consultez Images d'OS.IMAGE_PROJECT: projet contenant l'image de l'OS. Pour les images TPU, il s'agit deubuntu-os-accelerator-images.
Créer un modèle d'instance pour une VM Spot TPU
La commande suivante crée un modèle d'instance à l'aide de l'option de consommation Spot :
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=STOP \
--provisioning-model=SPOT \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Remplacez les espaces réservés suivants :
INSTANCE_TEMPLATE_NAME: nom de votre modèle d'instance.MACHINE_TYPE: type de machine pour la VM TPU, par exemplect6e-standard-8t.IMAGE_FAMILY: famille d'images d'OS pour la VM TPU. Si vous souhaitez installer une version spécifique de l'OS, utilisez l'option--image. Pour en savoir plus sur les images d'OS, consultez Images d'OS.IMAGE_PROJECT: projet contenant l'image de l'OS. Pour les images TPU, il s'agit deubuntu-os-accelerator-images.
Créer un modèle d'instance pour une VM liée à une réservation de TPU
La commande suivante crée un modèle d'instance à l'aide de l'option de consommation liée à la réservation :
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--reservation-affinity=specific \
--provisioning-model=reservation-bound \
--reservation=RESERVATION_NAME \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Remplacez les espaces réservés suivants :
INSTANCE_TEMPLATE_NAME: nom de votre modèle d'instance.MACHINE_TYPE: type de machine pour la VM TPU, par exemplect6e-standard-8t.RESERVATION_NAME: nom de la réservation spécifique à consommer.IMAGE_FAMILY: famille d'images d'OS pour la VM TPU. Si vous souhaitez installer une version spécifique de l'OS, utilisez l'option--image. Pour en savoir plus sur les images d'OS, consultez Images d'OS.IMAGE_PROJECT: projet contenant l'image de l'OS. Pour les images TPU, il s'agit deubuntu-os-accelerator-images.
Créer un modèle d'instance pour une VM TPU à démarrage flexible
La commande suivante crée un modèle d'instance à l'aide de l'option de consommation à démarrage flexible :
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--provisioning-model=FLEX_START \
--max-run-duration=DURATION \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Remplacez les espaces réservés suivants :
INSTANCE_TEMPLATE_NAME: nom de votre modèle d'instance.MACHINE_TYPE: type de machine pour la VM TPU, par exemplect6e-standard-8t.DURATION: durée maximale d'exécution de la VM TPU.IMAGE_FAMILY: famille d'images d'OS pour la VM TPU. Si vous souhaitez installer une version spécifique de l'OS, utilisez l'option--image. Pour en savoir plus sur les images d'OS, consultez Images d'OS.IMAGE_PROJECT: projet contenant l'image de l'OS. Pour les images TPU, il s'agit deubuntu-os-accelerator-images.
Créer une règle de charge de travail
Vous devez créer une règle de charge de travail avec le paramètre accelerator-topology (par exemple, 4x4, 8x8 ou 4x4x4). La topologie d'accélérateur configure le MIG pour qu'il traite les instances comme une tranche unique et interconnectée.
La commande suivante crée une règle de charge de travail :
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--type=high-throughput \
--accelerator-topology=TOPOLOGY \
--region=REGION
Remplacez les espaces réservés suivants :
WORKLOAD_POLICY_NAME: nom de votre stratégie de charge de travail.TOPOLOGY: topologie des VM TPU, par exemple4x4x8. Pour en savoir plus sur la topologie de chaque version de TPU, consultez Topologie TPU.REGION: région de votre règle de charge de travail.
Créer un MIG
Créez un MIG zonal ou régional à l'aide de la commande gcloud compute instance-groups managed create comme suit :
Pour créer un MIG zonal contenant une tranche de TPU multi-hôte, utilisez la commande suivante :
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --zone=ZONE \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URLPour créer un MIG régional contenant une tranche TPU multi-hôte, utilisez la commande suivante :
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --region=REGION \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URL \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none
Remplacez les espaces réservés suivants :
MIG_NAME: nom de votre MIG.MIG_SIZE: nombre de VM dans le MIG.INSTANCE_TEMPLATE_URL: URL du modèle d'instance que vous souhaitez utiliser pour créer des instances dans le MIG. L'URL peut contenir l'ID ou le nom du modèle d'instance. Spécifiez une des valeurs suivantes :- Pour un modèle d'instance régional :
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Pour un modèle d'instance global :
INSTANCE_TEMPLATE_ID
- Pour un modèle d'instance régional :
ZONE: zone de votre MIG.REGION: région de votre MIG.WORKLOAD_POLICY_URL: URL de la règle de charge de travail que vous souhaitez utiliser pour créer des instances dans le MIG. Exemple :projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME.
Créer des VM avec des noms personnalisés dans un MIG
Vous pouvez créer des VM dans un MIG en spécifiant des noms personnalisés pour chacune d'elles. Cela est utile pour le débogage et pour s'assurer que les instances sont créées dans un ordre spécifique.
Les MIG contenant une tranche de TPU multi-hôte utilisent le mode groupé de la règle de taille cible. Lorsque vous créez des VM avec des noms personnalisés dans un tel MIG, les éléments suivants s'appliquent :
Vous devez d'abord vérifier que le MIG ne contient aucune VM. Si le MIG comporte des VM, vous devez redimensionner le MIG pour atteindre la taille cible
0ou créer un autre MIG avec la taille cible0.Vous ne pouvez utiliser l'API REST que pour créer des VM avec des noms personnalisés.
Créez des VM avec des noms personnalisés à l'aide de l'une des méthodes d'API REST suivantes :
Pour un MIG zonal, utilisez
instanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }Pour un MIG régional, utilisez
regionInstanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }
Remplacez les espaces réservés suivants :
PROJECT_ID: ID du projet dans lequel se trouve le MIG.ZONE: zone du MIG.REGION: région du MIG.INSTANCE_NAME_1,2,..: noms des VM à ajouter au MIG spécifié.
Étapes suivantes
- Se connecter à une instance de TPU
- Afficher les propriétés d'un MIG
- Afficher l'état d'une tranche de TPU
- Supprimer un MIG