Crea un MIG con una porción de Cloud TPU de varios hosts

En este documento, se describe cómo crear un grupo de instancias administrado (MIG) con un segmento de TPU de varios hosts.

Requisitos previos

Completa los siguientes requisitos previos:

  1. Crea un proyecto para tus TPU como se describe en Configura un proyecto para las TPU.
  2. Determina tus requisitos de TPU como se describe en Planifica tus recursos.

Crea un MIG con porciones de TPU de varios hosts

  1. Crea una plantilla de instancias.
  2. Crea una política de cargas de trabajo.
  3. Crea el MIG.

Crea una plantilla de instancias

El comando para crear una plantilla de instancias depende de la opción de consumo que uses: a pedido, Spot, vinculada a la reserva o de inicio flexible. Para obtener más información sobre las opciones de consumo, consulta Planifica tus recursos de TPU.

Crea una plantilla de instancias para una VM de TPU a pedido

El siguiente comando crea una plantilla de instancias con la opción de consumo a pedido:

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
  --machine-type=MACHINE_TYPE \
  --maintenance-policy=TERMINATE \
  --image-family=IMAGE_FAMILY \
  --image-project=IMAGE_PROJECT

Reemplaza los marcadores de posición que se indican más abajo:

  • INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instancias
  • MACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo, ct6e-standard-8t.
  • IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca --image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.
  • IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, es ubuntu-os-accelerator-images.

Crea una plantilla de instancias para una VM Spot de TPU

El siguiente comando crea una plantilla de instancias con la opción de consumo de instancias Spot:

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
  --machine-type=MACHINE_TYPE \
  --maintenance-policy=TERMINATE \
  --instance-termination-action=STOP \
  --provisioning-model=SPOT \
  --image-family=IMAGE_FAMILY \
  --image-project=IMAGE_PROJECT

Reemplaza los marcadores de posición que se indican más abajo:

  • INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instancias
  • MACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo, ct6e-standard-8t.
  • IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca --image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.
  • IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, es ubuntu-os-accelerator-images.

Crea una plantilla de instancias para una VM vinculada a una reserva de TPU

El siguiente comando crea una plantilla de instancias con la opción de consumo vinculada a la reserva:

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
  --machine-type=MACHINE_TYPE \
  --maintenance-policy=TERMINATE \
  --instance-termination-action=DELETE \
  --reservation-affinity=specific \
  --provisioning-model=reservation-bound \
  --reservation=RESERVATION_NAME \
  --image-family=IMAGE_FAMILY \
  --image-project=IMAGE_PROJECT

Reemplaza los marcadores de posición que se indican más abajo:

  • INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instancias
  • MACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo, ct6e-standard-8t.
  • RESERVATION_NAME: Es el nombre de la reserva específica que se consumirá.
  • IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca --image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.
  • IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, es ubuntu-os-accelerator-images.

Crea una plantilla de instancias para una VM de TPU con inicio flexible

El siguiente comando crea una plantilla de instancias con la opción de consumo de inicio flexible:

gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
    --machine-type=MACHINE_TYPE \
    --maintenance-policy=TERMINATE \
    --instance-termination-action=DELETE \
    --provisioning-model=FLEX_START \
    --max-run-duration=DURATION \
    --image-family=IMAGE_FAMILY \
    --image-project=IMAGE_PROJECT

Reemplaza los marcadores de posición que se indican más abajo:

  • INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instancias
  • MACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo, ct6e-standard-8t.
  • DURATION: Es la duración máxima durante la que se puede ejecutar la VM de TPU.
  • IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca --image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.
  • IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, es ubuntu-os-accelerator-images.

Crear una política de cargas de trabajo

Debes crear una política de carga de trabajo con el parámetro accelerator-topology (por ejemplo, 4x4, 8x8 o 4x4x4). La topología del acelerador configura el MIG para que trate las instancias como una sola porción interconectada.

El siguiente comando crea una política de cargas de trabajo:

gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
  --type=high-throughput \
  --accelerator-topology=TOPOLOGY \
  --region=REGION

Reemplaza los marcadores de posición que se indican más abajo:

  • WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.
  • TOPOLOGY: Es la topología de las VMs de TPU, por ejemplo, 4x4x8. Para obtener más información sobre la topología de cada versión de TPU, consulta Arquitectura del sistema.
  • REGION: Es la región de tu política de carga de trabajo.

Crear un MIG

Crea un MIG zonal o regional con el comando gcloud compute instance-groups managed create de la siguiente manera:

  • Para crear un MIG zonal que contenga una porción de TPU de varios hosts, usa el siguiente comando:

     gcloud compute instance-groups managed create MIG_NAME \
        --size=MIG_SIZE \
        --target-size-policy-mode=bulk \
        --template=INSTANCE_TEMPLATE_URL \
        --zone=ZONE \
        --default-action-on-vm-failure=do-nothing \
        --workload-policy=WORKLOAD_POLICY_URL
    
  • Para crear un MIG regional que contenga una porción de TPU de varios hosts, usa el siguiente comando:

     gcloud compute instance-groups managed create MIG_NAME \
        --size=MIG_SIZE \
        --target-size-policy-mode=bulk \
        --template=INSTANCE_TEMPLATE_URL \
        --region=REGION \
        --default-action-on-vm-failure=do-nothing \
        --workload-policy=WORKLOAD_POLICY_URL \
        --target-distribution-shape=any-single-zone \
        --instance-redistribution-type=none
    

Reemplaza los marcadores de posición que se indican más abajo:

  • MIG_NAME: Es el nombre de tu MIG.
  • MIG_SIZE: Es la cantidad de VMs en el MIG.
  • INSTANCE_TEMPLATE_URL: Es la URL de la plantilla de instancias que deseas usar para crear instancias en el MIG. La URL puede contener el ID o el nombre de la plantilla de instancias. Especifica uno de los siguientes valores:
    • Para una plantilla de instancias regional: projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID
    • Para una plantilla de instancias global: INSTANCE_TEMPLATE_ID
  • ZONE: Es la zona de tu MIG.
  • REGION: Es la región de tu MIG.
  • WORKLOAD_POLICY_URL: Es la URL de la política de cargas de trabajo que deseas usar para crear instancias en el MIG. Por ejemplo: projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME

Crea VMs con nombres personalizados en un MIG

Puedes crear VMs en un MIG especificando nombres personalizados para cada VM. Esto es útil para depurar y garantizar que las instancias se creen en un orden específico.

Los MIG que contienen una porción de TPU de varios hosts usan el modo masivo de la política de tamaño objetivo. Cuando creas VMs con nombres personalizados en un MIG de este tipo, se aplica lo siguiente:

  • Primero, debes verificar que el MIG no contenga VMs. Si el MIG tiene VMs, debes cambiar el tamaño del MIG al tamaño objetivo 0 o crear otro MIG con el tamaño objetivo 0.

  • Solo puedes usar la API de REST para crear VMs con nombres personalizados.

Crea VMs con nombres personalizados usando uno de los siguientes métodos de la API de REST:

  • Para un MIG zonal, usa instanceGroupManagers.createInstances.

     POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/createInstances
     {
       "instances": [
         {
           "name": "INSTANCE_NAME_1"
         },
         {
           "name": "INSTANCE_NAME_2"
         },
         ...
       ]
     }
     

  • Para un MIG regional, usa regionInstanceGroupManagers.createInstances.

     POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/createInstances
     {
       "instances": [
         {
           "name": "INSTANCE_NAME_1"
         },
         {
           "name": "INSTANCE_NAME_2"
         },
         ...
       ]
     }
     

Reemplaza los marcadores de posición que se indican más abajo:

  • PROJECT_ID: Es el ID del proyecto en el que existe el MIG.
  • ZONE: Es la zona del MIG.
  • REGION: Es la región del MIG.
  • INSTANCE_NAME_1,2,..: Nombres de las VMs que se agregarán al MIG especificado.

¿Qué sigue?