En este documento, se describe cómo crear un grupo de instancias administrado (MIG) que forme un segmento de TPU de varios hosts.
Antes de comenzar
- Revisa las limitaciones para crear MIGs con instancias de TPU.
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los servicios y las APIs de Google Cloud . Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
-
Instala Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
gcloud initSi usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.
- Configura una región y una zona predeterminadas.
-
Requisitos previos
Antes de crear una porción de TPU de varios hosts, debes hacer lo siguiente:
Elige la versión de TPU: Selecciona la versión de TPU adecuada para tu carga de trabajo. Para obtener una lista de las versiones de TPU por tipo de carga de trabajo, consulta Versiones de TPU recomendadas por tipo de carga de trabajo.
Valida la disponibilidad de las TPU en tu ubicación preferida: Las TPU están disponibles en regiones Google Cloud específicas. Para usar una versión de TPU, asegúrate de que esté disponible en la región que prefieras. Para obtener una lista de las ubicaciones de las TPU, consulta Disponibilidad de las TPU.
Asegúrate de que tu proyecto tenga suficiente cuota de TPU: Si creas una porción de TPU de varios hosts con VMs según demanda o Spot, debes tener suficiente cuota de TPU disponible en la región que deseas usar. La creación de una porción de TPU de varios hosts que consuma una reserva de TPU no requiere ninguna cuota de TPU, ya que la cuota se usó cuando se creó la reserva. Para obtener una lista de los nombres de las cuotas de TPU, consulta Cuota de TPU y, para obtener instrucciones sobre cómo ver la cuota, consulta Visualiza y administra cuotas.
Elige una opción de consumo de TPU: Selecciona la opción de consumo que mejor se adapte a tu carga de trabajo, su duración y tus necesidades de costos. Para obtener una lista de la disponibilidad de las opciones de consumo por versiones de TPU, consulta Opciones de consumo de TPU.
Elige una topología: Selecciona una topología compatible con la versión de TPU seleccionada. Para obtener una lista de las topologías disponibles para cada versión de TPU, consulta Topología de TPU.
Crea un MIG con porciones de TPU de varios hosts
- Crea una plantilla de instancias.
- Crea una política de cargas de trabajo.
- Crea el MIG.
Crea una plantilla de instancias
El comando para crear una plantilla de instancias depende de la opción de consumo que uses: a pedido, Spot, vinculada a la reserva o de inicio flexible. Para obtener más información sobre las opciones de consumo, consulta Acerca de los modelos de aprovisionamiento de VMs.
Crea una plantilla de instancias para una VM de TPU a pedido
El siguiente comando crea una plantilla de instancias con la opción de consumo a pedido:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM Spot de TPU
El siguiente comando crea una plantilla de instancias con la opción de consumo de instancias Spot:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=STOP \
--provisioning-model=SPOT \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM vinculada a una reserva de TPU
El siguiente comando crea una plantilla de instancias con la opción de consumo vinculada a la reserva:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--reservation-affinity=specific \
--provisioning-model=reservation-bound \
--reservation=RESERVATION_NAME \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.RESERVATION_NAME: Es el nombre de la reserva específica que se consumirá.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM de TPU con inicio flexible
El siguiente comando crea una plantilla de instancias con la opción de consumo de inicio flexible:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--provisioning-model=FLEX_START \
--max-run-duration=DURATION \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: El nombre de la plantilla de instanciasMACHINE_TYPE: El tipo de máquina de la VM de TPU, por ejemplo,ct6e-standard-8t.DURATION: Es la duración máxima durante la que se puede ejecutar la VM de TPU.IMAGE_FAMILY: Es la familia de imágenes del SO de la VM de TPU. Si deseas instalar una versión específica del SO, usa la marca--image. Para obtener más información sobre las imágenes de SO, consulta Imágenes de SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crear una política de cargas de trabajo
Debes crear una política de carga de trabajo con el parámetro accelerator-topology (por ejemplo, 4x4, 8x8 o 4x4x4). La topología del acelerador configura el MIG para que trate las instancias como una sola porción interconectada.
El siguiente comando crea una política de cargas de trabajo:
gcloud compute resource-policies create workload-policy WORKLOAD_POLICY_NAME \
--type=high-throughput \
--accelerator-topology=TOPOLOGY \
--region=REGION
Reemplaza los marcadores de posición que se indican más abajo:
WORKLOAD_POLICY_NAME: Es el nombre de tu política de carga de trabajo.TOPOLOGY: Es la topología de las VMs de TPU, por ejemplo,4x4x8. Para obtener más información sobre la topología de cada versión de TPU, consulta Topología de TPU.REGION: Es la región de tu política de carga de trabajo.
Crear un MIG
Crea un MIG zonal o regional con el comando gcloud compute instance-groups managed create de la siguiente manera:
Para crear un MIG zonal que contenga una porción de TPU de varios hosts, usa el siguiente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --zone=ZONE \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URLPara crear un MIG regional que contenga una porción de TPU de varios hosts, usa el siguiente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --target-size-policy-mode=bulk \ --template=INSTANCE_TEMPLATE_URL \ --region=REGION \ --default-action-on-vm-failure=do-nothing \ --workload-policy=WORKLOAD_POLICY_URL \ --target-distribution-shape=any-single-zone \ --instance-redistribution-type=none
Reemplaza los marcadores de posición que se indican más abajo:
MIG_NAME: Es el nombre de tu MIG.MIG_SIZE: Es la cantidad de VMs en el MIG.INSTANCE_TEMPLATE_URL: Es la URL de la plantilla de instancias que deseas usar para crear instancias en el MIG. La URL puede contener el ID o el nombre de la plantilla de instancias. Especifica uno de los siguientes valores:- Para una plantilla de instancias regional:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Para una plantilla de instancias global:
INSTANCE_TEMPLATE_ID
- Para una plantilla de instancias regional:
ZONE: Es la zona de tu MIG.REGION: Es la región de tu MIG.WORKLOAD_POLICY_URL: Es la URL de la política de cargas de trabajo que deseas usar para crear instancias en el MIG. Por ejemplo:projects/PROJECT_ID/regions/WORKLOAD_POLICY_REGION/resourcePolicies/WORKLOAD_POLICY_NAME
Crea VMs con nombres personalizados en un MIG
Puedes crear VMs en un MIG especificando nombres personalizados para cada VM. Esto es útil para depurar y garantizar que las instancias se creen en un orden específico.
Los MIG que contienen una porción de TPU de varios hosts usan el modo masivo de la política de tamaño objetivo. Cuando creas VMs con nombres personalizados en un MIG de este tipo, se aplica lo siguiente:
Primero, debes verificar que el MIG no contenga VMs. Si el MIG tiene VMs, debes cambiar el tamaño del MIG al tamaño objetivo
0o crear otro MIG con el tamaño objetivo0.Solo puedes usar la API de REST para crear VMs con nombres personalizados.
Crea VMs con nombres personalizados usando uno de los siguientes métodos de la API de REST:
Para un MIG zonal, usa
instanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }Para un MIG regional, usa
regionInstanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }
Reemplaza los marcadores de posición que se indican más abajo:
PROJECT_ID: Es el ID del proyecto en el que existe el MIG.ZONE: Es la zona del MIG.REGION: Es la región del MIG.INSTANCE_NAME_1,2,..: Nombres de las VMs que se agregarán al MIG especificado.
¿Qué sigue?
- Conéctate a una instancia de TPU
- Cómo ver las propiedades de un MIG
- Cómo ver el estado de una porción de TPU
- Borra un MIG