Créer des VM Cloud TPU
Vous créez des VM TPU à l'aide de l'API Create Node, de l'API des ressources en file d'attente ou de Google Kubernetes Engine (GKE).
Vous appelez l'API Create Node lorsque vous exécutez la gcloud compute tpus tpu-vm create
commande à l'aide de Google Cloud CLI et lorsque vous créez une VM TPU à l'aide de la
Google Cloud console. Lorsque vous utilisez l'API Create Node, le système traite votre requête immédiatement. Si la capacité est insuffisante pour répondre à votre requête, celle-ci échoue.
Nous vous recommandons de créer des VM TPU à l'aide de l'API des ressources en file d'attente. Lorsque vous créez une VM TPU à l'aide de l'API des ressources en file d'attente, le service Cloud TPU ajoute votre requête de ressource en file d'attente à une file d'attente qu'il gère. Lorsque la ressource demandée devient disponible, le service l'attribue à votre Google Cloud projet pour une utilisation immédiate et exclusive. Pour en savoir plus, consultez Gérer les ressources en file d'attente.
Si vous souhaitez utiliser Google Kubernetes Engine (GKE) pour gérer les ressources TPU, commencez par créer un cluster GKE. Ajoutez ensuite à votre cluster des pools de nœuds contenant des tranches de TPU. Pour en savoir plus, consultez À propos des TPU dans GKE.
Prérequis
Suivez les consignes ci-dessous :
Créez un Google Cloud projet pour vos TPU, comme décrit dans Configurer un Google Cloud projet pour les TPU.
Déterminez vos besoins en matière de TPU, comme décrit dans Planifier vos ressources Cloud TPU.
Si vous utilisez l'une des bibliothèques clientes Cloud, suivez les instructions de configuration pour le langage que vous utilisez :
Définissez des variables d'environnement pour créer un TPU v5e avec huit puces. Les exemples suivants utilisent un TPU v5e avec huit puces. Vous pouvez spécifier un autre type et une autre version d'accélérateur. Pour en savoir plus, consultez Versions de TPU.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Créer un Cloud TPU à l'aide de l'API Create Node
Vous créez un Cloud TPU à l'aide de gcloud, de la Google Cloud console,
ou de l'API Cloud TPU.
Lorsque vous créez un Cloud TPU, spécifiez la version logicielle du TPU (également appelée version de l'environnement d'exécution). Pour déterminer la version logicielle à utiliser, consultez Versions logicielles de TPU.
Spécifiez également le nombre de TensorCores ou de puces TPU pour la configuration TPU que vous utilisez. Pour en savoir plus, consultez la section correspondant à votre version de TPU dans Architecture du système.
gcloud
.Utilisez la gcloud compute tpus tpu-vm create
commande pour créer un TPU à l'aide de l'API Create Node. Consultez
Adresses IP externes et internes
pour configurer des adresses IP internes ou externes spécifiques.
La commande suivante crée une VM TPU v5e avec huit puces TPU :
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Description des flags de commande
zone- Zone dans laquelle vous créez votre Cloud TPU.
accelerator-type- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous créez. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
version- Version du logiciel TPU version.
Console
Ces instructions créent une VM TPU v5e avec huit puces TPU :
Dans la Google Cloud console, accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous créez le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous créez. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur Créer pour créer vos ressources.
curl
La commande suivante utilise curl pour créer une VM TPU v5e avec huit puces TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Champs obligatoires
runtime_version- Version d'exécution de Cloud TPU que vous utilisez.
project-id- Nom du projetenregistré Google Cloud .
zone- Zone dans laquelle vous créez votre Cloud TPU.
node_name- Nom de la VM TPU que vous créez.
Java
Cet exemple de code crée une VM TPU v5e avec huit puces TPU à l'aide de l'API Cloud TPU en Java.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Cet exemple de code crée une VM TPU v5e avec huit puces TPU à l'aide de l'API Cloud TPU dans Node.js.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Cet exemple de code crée une VM TPU v5e avec huit puces TPU à l'aide de l'API Cloud TPU en Python.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Exécuter un script de démarrage
Vous exécutez un script de démarrage sur votre VM TPU en spécifiant le flag --metadata startup-script lorsque vous créez la VM TPU.
gcloud
Cette commande crée une VM TPU et spécifie un script de démarrage.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
Cet exemple de code crée une VM TPU et spécifie un script de démarrage en Java.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Cet exemple de code crée une VM TPU et spécifie un script de démarrage dans Node.js.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Cet exemple de code crée une VM TPU et spécifie un script de démarrage en Python.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Étape suivante
- En savoir plus sur les ressources en file d'attente.
- Découvrez comment gérer les VM TPU.
- En savoir plus sur les TPU dans GKE.
- Découvrez comment exécuter du code JAX sur une VM TPU.
- Découvrez comment exécuter du code PyTorch sur une VM TPU.
- Découvrez comment exécuter une charge de travail ML sur des TPU, par exemple, diffuser Qwen2-72B-Instruct avec vLLM sur des TPU.