Crea un MIG con una porción de Cloud TPU de varios hosts
En este documento, se describe cómo crear un grupo de instancias administrado (MIG) con un segmento de TPU de varios hosts.
Requisitos previos
Completa los siguientes requisitos previos:
- Crea un proyecto para tus TPU como se describe en Configura un proyecto para las TPU.
- Determina tus requisitos de TPU como se describe en Planifica tus recursos.
Crea un MIG con porciones de TPU de varios hosts
- Crea una plantilla de instancias.
- Crea una política de cargas de trabajo.
- Crea el MIG.
Crea una plantilla de instancias
El comando para crear una plantilla de instancias depende de la opción de consumo que uses: a pedido, Spot, vinculada a la reserva o de inicio flexible. Para obtener más información sobre las opciones de consumo, consulta Planifica tus recursos de TPU.
Crea una plantilla de instancias para una VM de TPU a pedido
El siguiente comando crea una plantilla de instancias con la opción de consumo a pedido:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM Spot de TPU
El siguiente comando crea una plantilla de instancias con la opción de consumo de instancias Spot:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=STOP \
--provisioning-model=SPOT \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM vinculada a una reserva de TPU
El siguiente comando crea una plantilla de instancias con la opción de consumo vinculada a la reserva:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--reservation-affinity=specific \
--provisioning-model=reservation-bound \
--reservation=RESERVATION_NAME \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.RESERVATION_NAME: Es el nombre de la reserva específica que se consumirá.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM de TPU con inicio flexible
El siguiente comando crea una plantilla de instancias con la opción de consumo de inicio flexible:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--provisioning-model=FLEX_START \
--max-run-duration=DURATION \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.DURATION: Es la duración máxima durante la que se puede ejecutar la VM de TPU.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crear una política de cargas de trabajo
Debes crear una política de carga de trabajo con el parámetro accelerator-topology (por ejemplo, 4x4, 8x8 o 4x4x4). La topología del acelerador configura el MIG para que trate las instancias como una sola porción interconectada.
El siguiente comando crea una política de cargas de trabajo:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--type=high-throughput \
--accelerator-topology=TOPOLOGY \
--region=REGION
Reemplaza los marcadores de posición que se indican más abajo:
WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.TOPOLOGY: Es la topología de las VMs de TPU, por ejemplo,4x4x8. Para obtener más información sobre la topología de cada versión de TPU, consulta Arquitectura del sistema.REGION: Es la región de tu política de carga de trabajo.
Crear un MIG
Crea un MIG zonal o regional con el comando gcloud compute instance-groups managed create de la siguiente manera:
Para crear un MIG zonal que contenga una porción de TPU de varios hosts, usa el siguiente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --zone=ZONE \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URLPara crear un MIG regional que contenga una porción de TPU de varios hosts, usa el siguiente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --region=REGION \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URL \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none
Reemplaza los marcadores de posición que se indican más abajo:
MIG_NAME: Es el nombre de tu MIG.MIG_SIZE: Es la cantidad de VMs en el MIG.INSTANCE_TEMPLATE_URL: Es la URL de la plantilla de instancias que deseas usar para crear instancias en el MIG. La URL puede contener el ID o el nombre de la plantilla de instancias. Especifica uno de los siguientes valores:- Para una plantilla de instancias regional:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Para una plantilla de instancias global:
INSTANCE_TEMPLATE_ID
- Para una plantilla de instancias regional:
ZONE: Es la zona de tu MIG.REGION: Es la región de tu MIG.WORKLOAD_POLICY_URL: Es la URL de la política de cargas de trabajo que deseas usar para crear instancias en el MIG. Por ejemplo:projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME
Crea VMs con nombres personalizados en un MIG
Puedes crear VMs en un MIG especificando nombres personalizados para cada VM. Esto es útil para depurar y garantizar que las instancias se creen en un orden específico.
Los MIG que contienen una porción de TPU de varios hosts usan el modo masivo de la política de tamaño objetivo. Cuando creas VMs con nombres personalizados en un MIG de este tipo, se aplica lo siguiente:
Primero, debes verificar que el MIG no contenga VMs. Si el MIG tiene VMs, debes cambiar el tamaño del MIG al tamaño objetivo
0o crear otro MIG con el tamaño objetivo0.Solo puedes usar la API de REST para crear VMs con nombres personalizados.
Crea VMs con nombres personalizados usando uno de los siguientes métodos de la API de REST:
Para un MIG zonal, usa
instanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }Para un MIG regional, usa
regionInstanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }
Reemplaza los marcadores de posición que se indican más abajo:
PROJECT_ID: Es el ID del proyecto en el que existe el MIG.ZONE: Es la zona del MIG.REGION: Es la región del MIG.INSTANCE_NAME_1,2,..: Nombres de las VMs que se agregarán al MIG especificado.
¿Qué sigue?
- Obtén información sobre las VMs de TPU y los MIGs.
- Obtén información para crear un MIG con una porción de Cloud TPU de host único.
- Obtén más información para administrar VMs de TPU.
- Obtén más información sobre las TPU en GKE.
- Aprende a ejecutar una carga de trabajo de AA en TPU, por ejemplo, cómo entregar Qwen2-72B-Instruct con vLLM en TPU.