Créer des VM Cloud TPU
Vous pouvez créer des VM TPU à l'aide de l'API Create Node, de l'API Queued Resources ou de Google Kubernetes Engine (GKE).
Vous appelez l'API Create Node lorsque vous exécutez la commande gcloud compute tpus tpu-vm create à l'aide de la Google Cloud CLI et lorsque vous créez une VM TPU à l'aide de la consoleGoogle Cloud . Lorsque vous utilisez l'API Create Node, le système traite votre demande immédiatement. Si la capacité est insuffisante pour traiter votre demande, celle-ci échouera.
Nous vous recommandons de créer des VM TPU à l'aide de l'API Queued Resources. Lorsque vous créez une VM TPU à l'aide de l'API des ressources en file d'attente, le service Cloud TPU ajoute votre demande de ressource en file d'attente à une file d'attente qu'il gère. Lorsque la ressource demandée devient disponible, le service l'attribue à votre projet Google Cloud pour votre usage exclusif immédiat. Pour en savoir plus, consultez Gérer les ressources mises en file d'attente.
Si vous souhaitez utiliser Google Kubernetes Engine (GKE) pour gérer les ressources TPU, commencez par créer un cluster GKE. Vous ajoutez ensuite à votre cluster des pools de nœuds contenant des tranches de TPU. Pour en savoir plus, consultez À propos des TPU dans GKE.
Prérequis
Remplissez les conditions préalables suivantes :
Créez un projet Google Cloud pour vos TPU, comme décrit dans Configurer un projet Google Cloud pour les TPU.
Déterminez vos besoins en TPU comme décrit dans Planifier vos ressources Cloud TPU.
Si vous utilisez l'une des bibliothèques clientes Cloud, suivez les instructions de configuration pour le langage que vous utilisez :
Définissez des variables d'environnement pour créer un TPU v5e avec huit puces. Les exemples suivants utilisent un TPU v5e avec huit puces. Vous pouvez spécifier un type et une version d'accélérateur différents. Pour en savoir plus, consultez Versions de TPU.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Créer un Cloud TPU à l'aide de l'API Create Node
Vous pouvez créer un Cloud TPU à l'aide de gcloud, de la console Google Cloud ou de l'API Cloud TPU.
Lorsque vous créez un Cloud TPU, spécifiez la version logicielle du TPU (également appelée version de l'environnement d'exécution). Pour déterminer la version logicielle à utiliser, consultez Versions logicielles de TPU.
Spécifiez également le nombre de TensorCores ou de puces TPU pour la configuration TPU que vous utilisez. Pour en savoir plus, consultez la section correspondant à votre version de TPU dans Architecture du système.
gcloud
Exécutez la commande gcloud compute tpus tpu-vm create pour créer un TPU à l'aide de l'API Create Node. Pour configurer des adresses IP internes ou externes spécifiques, consultez Adresses IP externes et internes.
La commande suivante crée une VM TPU v5e avec huit puces TPU :
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Description des flags de commande
zone- Zone dans laquelle vous créez votre Cloud TPU.
accelerator-type- Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous créez. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
version- Version du logiciel TPU.
Console
Ces instructions permettent de créer une VM TPU v5e avec huit puces TPU :
Dans la console Google Cloud , accédez à la page TPU :
Cliquez sur Créer un TPU.
Dans le champ Nom, saisissez un nom pour votre TPU.
Dans le champ Zone, sélectionnez la zone dans laquelle vous créez le TPU.
Dans le champ Type de TPU, sélectionnez un type d'accélérateur. Le type d'accélérateur spécifie la version et la taille du Cloud TPU que vous créez. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez Versions de TPU.
Dans le champ Version logicielle du TPU, sélectionnez une version logicielle. Lorsque vous créez une VM Cloud TPU, la version logicielle TPU spécifie la version de l'environnement d'exécution TPU à installer. Pour en savoir plus, consultez Versions logicielles de TPU.
Cliquez sur Créer pour créer vos ressources.
curl
La commande suivante utilise curl pour créer une VM TPU v5e avec huit puces TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Champs obligatoires
runtime_version- Version d'exécution de Cloud TPU que vous utilisez.
project-id- Nom du projet Google Cloud enregistré.
zone- Zone dans laquelle vous créez votre Cloud TPU.
node_name- Nom de la VM TPU que vous créez.
Java
Cet exemple de code crée une VM TPU v5e avec huit puces TPU à l'aide de l'API Cloud TPU en Java.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Cet exemple de code crée une VM TPU v5e avec huit puces TPU à l'aide de l'API Cloud TPU dans Node.js.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Cet exemple de code crée une VM TPU v5e avec huit puces TPU à l'aide de l'API Cloud TPU en Python.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Exécuter un script de démarrage
Vous pouvez exécuter un script de démarrage sur votre VM TPU en spécifiant le flag --metadata startup-script lors de la création de la VM TPU.
gcloud
Cette commande crée une VM TPU et spécifie un script de démarrage.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
Cet exemple de code crée une VM TPU et spécifie un script de démarrage en Java.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Cet exemple de code crée une VM TPU et spécifie un script de démarrage en Node.js.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Cet exemple de code crée une VM TPU et spécifie un script de démarrage en Python.
Pour vous authentifier auprès de Cloud TPU, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Étapes suivantes
- En savoir plus sur les ressources en file d'attente
- Découvrez comment gérer les VM TPU.
- En savoir plus sur les TPU dans GKE
- Découvrez comment exécuter du code JAX sur une VM TPU.
- Découvrez comment exécuter du code PyTorch sur une VM TPU.
- Découvrez comment exécuter une charge de travail de ML sur des TPU, par exemple Mettre en service Qwen2-72B-Instruct avec vLLM sur des TPU.