Crea VMs de Cloud TPU
Puedes crear VMs de TPU con la API de Create Node, la API de Queued Resources o Google Kubernetes Engine (GKE).
Llamas a la API de Create Node cuando ejecutas el comando gcloud compute tpus tpu-vm create con Google Cloud CLI y cuando creas una VM de TPU con la consola deGoogle Cloud . Cuando usas la API de Create Node, el sistema procesa tu solicitud de inmediato. Si no hay capacidad suficiente para satisfacer tu solicitud, esta fallará.
Te recomendamos que crees VMs de TPU con la API de recursos en cola. Cuando creas una VM de TPU con la API de recursos en cola, el servicio de Cloud TPU agrega tu solicitud de recursos en cola a una cola que mantiene el servicio. Cuando el recurso solicitado está disponible, el servicio lo asigna a tu proyecto de Google Cloud para que lo uses de forma inmediata y exclusiva. Para obtener más información, consulta Administra recursos en cola.
Si quieres usar Google Kubernetes Engine (GKE) para administrar recursos de TPU, primero debes crear un clúster de GKE. Luego, agrega grupos de nodos que contengan segmentos de TPU a tu clúster. Para obtener más información, consulta Acerca de las TPU en GKE.
Requisitos previos
Completa los siguientes requisitos previos:
Crea un proyecto de Google Cloud para tus TPU como se describe en Configura un proyecto de Google Cloud para las TPU.
Determina tus requisitos de TPU como se describe en Planifica tus recursos de Cloud TPU.
Si usas una de las bibliotecas cliente de Cloud, sigue las instrucciones de configuración para el lenguaje que usas:
Establece variables de entorno para crear una TPU v5e con ocho chips. En los siguientes ejemplos, se usa una TPU v5e con ocho chips. Puedes especificar un tipo y una versión de acelerador diferentes. Consulta Versiones de TPU para obtener más información.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Crea una Cloud TPU con la API de creación de nodos
Puedes crear una Cloud TPU con gcloud, la consola de Google Cloud
o la API de Cloud TPU.
Cuando crees una Cloud TPU, especifica la versión de software de la TPU (también llamada versión del entorno de ejecución). Para determinar qué versión de software debes usar, consulta Versiones de software de TPU.
Además, especifica la cantidad de TensorCores o chips TPU para la configuración de TPU que usas. Para obtener más información, consulta la sección de tu versión de TPU en Arquitectura del sistema.
gcloud
Usa el comando gcloud compute tpus tpu-vm create para crear una TPU con la API de Create Node. Consulta Direcciones IP internas y externas para configurar direcciones IP internas o externas específicas.
El siguiente comando crea una VM de TPU v5e con 8 chips de TPU:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Descripciones de las marcas de comandos
zone- Es la zona en la que crearás tu Cloud TPU.
accelerator-type- El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que creas. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
version- Es la versión de software de la TPU.
Console
Estas instrucciones crean una VM de TPU v5e con 8 chips de TPU:
En la consola de Google Cloud , ve a la página TPU:
Haz clic en Crear una TPU.
En el campo Nombre, ingresa el nombre de tu TPU.
En el campo Zona, selecciona la zona en la que crearás la TPU.
En el campo Tipo de TPU, selecciona un tipo de acelerador. El tipo de acelerador especifica la versión y el tamaño de la Cloud TPU que creas. Para obtener más información sobre los tipos de aceleradores compatibles con cada versión de TPU, consulta Versiones de TPU.
En el campo Versión de software de TPU, selecciona una versión de software. Cuando creas una VM de Cloud TPU, la versión de software de TPU especifica la versión del entorno de ejecución de TPU que se instalará. Para obtener más información, consulta Versiones de software de TPU.
Haz clic en Crear para crear tus recursos.
curl
El siguiente comando usa curl para crear una VM de TPU v5e con 8 chips de TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Campos obligatorios
runtime_version- Es la versión del entorno de ejecución de Cloud TPU que usas.
project-id- Es el nombre de tu proyecto de Google Cloud registrado.
zone- Es la zona en la que crearás tu Cloud TPU.
node_name- Es el nombre de la VM de TPU que crearás.
Java
En este ejemplo de código, se crea una VM de TPU v5e con 8 chips de TPU usando la API de Cloud TPU en Java.
Para autenticarte en Cloud TPU, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
En este ejemplo de código, se crea una VM de TPU v5e con 8 chips de TPU usando la API de Cloud TPU en Node.js.
Para autenticarte en Cloud TPU, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
En este ejemplo de código, se crea una VM de TPU v5e con 8 chips de TPU usando la API de Cloud TPU en Python.
Para autenticarte en Cloud TPU, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Ejecuta una secuencia de comandos de inicio
Para ejecutar una secuencia de comandos de inicio en tu VM de TPU, especifica la marca --metadata startup-script cuando crees la VM de TPU.
gcloud
Este comando crea una VM de TPU y especifica una secuencia de comandos de inicio.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
En este ejemplo de código, se crea una VM de TPU y se especifica una secuencia de comandos de inicio en Java.
Para autenticarte en Cloud TPU, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Node.js
En este ejemplo de código, se crea una VM de TPU y se especifica una secuencia de comandos de inicio en Node.js.
Para autenticarte en Cloud TPU, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Python
En este ejemplo de código, se crea una VM de TPU y se especifica una secuencia de comandos de inicio en Python.
Para autenticarte en Cloud TPU, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
¿Qué sigue?
- Obtén más información sobre los recursos en cola.
- Obtén más información para administrar VMs de TPU.
- Obtén más información sobre las TPU en GKE.
- Obtén información para ejecutar código JAX en una VM de TPU.
- Aprende a ejecutar código de PyTorch en una VM de TPU.
- Aprende a ejecutar una carga de trabajo de AA en TPU, por ejemplo, cómo entregar Qwen2-72B-Instruct con vLLM en TPU.