En este documento, se describe cómo crear un grupo de instancias administrado (MIG) que forma porciones de TPU de un solo host. Una porción de TPU de un solo host se asigna a una instancia de máquina virtual (VM) de TPU.
También puedes crear una porción de TPU de un solo host como una instancia de TPU independiente. Para obtener más información, consulta Crea una instancia de VM de TPU.
Antes de comenzar
- Revisa las limitaciones para crear MIGs con instancias de TPU.
-
Si aún no lo hiciste, configura la autenticación.
La autenticación verifica tu identidad para acceder a los Google Cloud servicios y las APIs. Para ejecutar
código o muestras desde un entorno de desarrollo local, puedes autenticarte en
Compute Engine seleccionando una de las siguientes opciones:
-
Instala la Google Cloud CLI. Después de la instalación, inicializa Google Cloud CLI con el siguiente comando:
gcloud initSi usas un proveedor de identidad (IdP) externo, primero debes acceder a gcloud CLI con tu identidad federada.
- Configura una región y una zona predeterminadas.
-
Requisitos previos
Antes de crear una porción de TPU de un solo host, debes hacer lo siguiente:
Elige la versión de TPU: Selecciona la versión de TPU adecuada para tu carga de trabajo. Para obtener una lista de las versiones de TPU por tipo de carga de trabajo, consulta Versiones de TPU recomendadas por tipos de carga de trabajo.
Valida la disponibilidad de TPU en tu ubicación preferida: Las TPU están disponibles en regiones Google Cloud específicas. Para usar una versión de TPU, asegúrate de que esté disponible en tu región preferida. Para obtener una lista de las ubicaciones de TPU, consulta Disponibilidad de TPU.
Asegúrate de que tu proyecto tenga suficiente cuota de TPU: Si creas una porción de TPU de un solo host con VMs según demanda o Spot, debes tener suficiente cuota de TPU disponible en la región que deseas usar. Crear una porción de TPU de un solo host que consuma una reserva de TPU no requiere ninguna cuota de TPU, ya que la cuota se usa cuando se creó la reserva. Para obtener una lista de los nombres de cuota de TPU, consulta Cuota de TPU y, para obtener instrucciones sobre cómo ver la cuota, consulta Visualiza y administra cuotas
Elige una opción de consumo de TPU: Selecciona una opción de consumo que se adapte mejor a tu carga de trabajo, su duración y tus necesidades de costos. Para obtener una lista de la disponibilidad de las opciones de consumo por versiones de TPU, consulta Opciones de consumo de TPU.
Elige una topología: Selecciona una topología compatible con la versión de TPU seleccionada. Para obtener una lista de las topologías disponibles para cada versión de TPU, consulta Topología de TPU.
Crea un MIG con varias porciones de TPU de un solo host
Para crear varias VMs de TPU independientes en un MIG, haz lo siguiente:
- Crea una plantilla de instancias.
- Crea el MIG.
Crea una plantilla de instancias
Las configuraciones de la plantilla de instancias varían según la opción de consumo que uses: según demanda, Spot, reservas o inicio flexible. Para obtener más información sobre las opciones de consumo, consulta Acerca de los modelos de aprovisionamiento de VMs .
Crea una plantilla de instancias para una VM de TPU según demanda
El siguiente comando crea una plantilla de instancias que usa la opción de consumo según demanda:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: Es el nombre de la plantilla de instancias.MACHINE_TYPE: Es el tipo de máquina para la VM de TPU (por ejemplo,ct6e-standard-8t).IMAGE_FAMILY: Es la familia de imágenes del SO para la VM de TPU. Si deseas instalar una versión específica del SO, usa la--imagemarca. Para obtener más información sobre las imágenes del SO, consulta Imágenes del SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM Spot de TPU
El siguiente comando crea una plantilla de instancias que usa la opción de consumo Spot:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=STOP \
--provisioning-model=SPOT \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: Es el nombre de la plantilla de instancias.MACHINE_TYPE: Es el tipo de máquina para la VM de TPU (por ejemplo,ct6e-standard-8t).IMAGE_FAMILY: Es la familia de imágenes del SO para la VM de TPU. Si deseas instalar una versión específica del SO, usa la--imagemarca. Para obtener más información sobre las imágenes del SO, consulta Imágenes del SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM de TPU vinculada a la reserva
El siguiente comando crea una plantilla de instancias que usa la opción de consumo vinculada a la reserva:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--reservation-affinity=specific \
--provisioning-model=reservation-bound \
--reservation=RESERVATION_NAME \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: Es el nombre de la plantilla de instancias.MACHINE_TYPE: Es el tipo de máquina para la VM de TPU (por ejemplo,ct6e-standard-8t).RESERVATION_NAME: Es el nombre de una reserva específica que deseas consumir.IMAGE_FAMILY: Es la familia de imágenes del SO para la VM de TPU. Si deseas instalar una versión específica del SO, usa la--imagemarca. Para obtener más información sobre las imágenes del SO, consulta Imágenes del SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crea una plantilla de instancias para una VM de TPU de inicio flexible
El siguiente comando crea una plantilla de instancias que usa la opción de consumo inicio flexible:
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \
--machine-type=MACHINE_TYPE \
--maintenance-policy=TERMINATE \
--instance-termination-action=DELETE \
--provisioning-model=FLEX_START \
--max-run-duration=DURATION \
--image-family=IMAGE_FAMILY \
--image-project=IMAGE_PROJECT
Reemplaza los marcadores de posición que se indican más abajo:
INSTANCE_TEMPLATE_NAME: Es el nombre de la plantilla de instancias.MACHINE_TYPE: Es el tipo de máquina para la VM de TPU (por ejemplo,ct6e-standard-8t).DURATION: Es la duración máxima de ejecución de la VM de TPU (por ejemplo,1h).IMAGE_FAMILY: Es la familia de imágenes del SO para la VM de TPU. Si deseas instalar una versión específica del SO, usa la--imagemarca. Para obtener más información sobre las imágenes del SO, consulta Imágenes del SO.IMAGE_PROJECT: Es el proyecto que contiene la imagen de SO. Para las imágenes de TPU, esubuntu-os-accelerator-images.
Crear un MIG
Crea un MIG zonal o regional con el
gcloud compute instance-groups managed create comando de la siguiente manera:
Para crear un MIG zonal que contenga una porción de TPU de un solo host, usa el siguiente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --template=INSTANCE_TEMPLATE_URL \ --zone=ZONEPara crear un MIG regional que contenga una porción de TPU de un solo host, usa el siguiente comando:
gcloud compute instance-groups managed create MIG_NAME \ --size=MIG_SIZE \ --template=INSTANCE_TEMPLATE_URL \ --region=REGION \ --target-distribution-shape=ANY_SINGLE_ZONE \ --instance-redistribution-type=none
Reemplaza los marcadores de posición que se indican más abajo:
MIG_NAME: Es el nombre del MIG.MIG_SIZE: Es la cantidad de VMs en el MIG.INSTANCE_TEMPLATE_URL: Es la URL de la plantilla de instancias que deseas usar para crear instancias en el MIG. La URL puede contener el ID o el nombre de la plantilla de instancias. Especifica uno de los siguientes valores:- Para una plantilla de instancias regional:
projects/PROJECT_ID/regions/REGION/instanceTemplates/INSTANCE_TEMPLATE_ID - Para una plantilla de instancias global:
INSTANCE_TEMPLATE_ID
- Para una plantilla de instancias regional:
ZONE: Es la zona en la que deseas que se aprovisione el MIG.REGION: Es la región en la que deseas que se aprovisione el MIG.
Crea VMs con nombres personalizados en un MIG
Puedes crear VMs en un MIG si especificas nombres personalizados para cada VM. Esto es útil para la depuración y para garantizar que las instancias se creen en un orden específico.
gcloud
Crea una VM con un nombre personalizado con el
create-instance comando
y especifica la --instance marca. Para crear varias VMs, repite el comando para cada VM. De lo contrario, usa el método de la API de REST para especificar varias VMs en una sola solicitud.
Para un MIG zonal, usa el siguiente comando:
gcloud compute instance-groups managed create-instance MIG_NAME \ --zone=ZONE \ --instance=INSTANCE_NAMEPara un MIG regional, usa el siguiente comando:
gcloud compute instance-groups managed create-instance MIG_NAME \ --region=REGION \ --instance=INSTANCE_NAME
Reemplaza los marcadores de posición que se indican más abajo:
REST
Crea VMs con nombres personalizados con uno de los siguientes métodos de la API de REST:
Para un MIG zonal, usa el
instanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }Para un MIG regional, usa el
regionInstanceGroupManagers.createInstances.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/regions/REGION/instanceGroupManagers/MIG_NAME/createInstances { "instances": [ { "name": "INSTANCE_NAME_1" }, { "name": "INSTANCE_NAME_2" }, ... ] }
Reemplaza los marcadores de posición que se indican más abajo:
¿Qué sigue?
- Crea una porción de varios hosts
- Conéctate a una instancia de TPU
- Cómo ver las propiedades de un MIG
- Consulta el estado de una porción de TPU
- Borra un MIG