Creare VM Cloud TPU
Le VM TPU vengono create utilizzando l'API Create Node, l'API Queued Resources o Google Kubernetes Engine (GKE).
Chiami l'API Create Node quando esegui il gcloud compute tpus tpu-vm create
comando utilizzando Google Cloud CLI e quando crei una VM TPU utilizzando la
Google Cloud console. Quando utilizzi l'API Create Node, il sistema elabora immediatamente la richiesta. Se non è disponibile capacità sufficiente per soddisfare la richiesta, la richiesta non va a buon fine.
Ti consigliamo di creare VM TPU utilizzando l'API Queued Resources. Quando crei una VM TPU utilizzando l'API Queued Resources, il servizio Cloud TPU aggiunge la richiesta di risorse in coda a una coda gestita dal servizio. Quando la risorsa richiesta diventa disponibile, il servizio assegna al tuo Google Cloud progetto per un utilizzo immediato ed esclusivo. Per saperne di più, consulta Gestire le risorse in coda.
Se vuoi utilizzare Google Kubernetes Engine (GKE) per gestire le risorse TPU, crea prima un cluster GKE. Poi, aggiungi al cluster i pool di nodi contenenti sezioni TPU. Per saperne di più, consulta Informazioni sulle TPU in GKE.
Prerequisiti
Completa i seguenti prerequisiti:
Crea un Google Cloud progetto per le TPU come descritto in Configurare un Google Cloud progetto per le TPU.
Determina i requisiti della TPU come descritto in Pianificare le risorse Cloud TPU.
Se utilizzi una delle librerie client di Cloud, segui le istruzioni di configurazione per il linguaggio che stai utilizzando:
Imposta le variabili di ambiente per la creazione di una TPU v5e con otto chip. Gli esempi seguenti utilizzano una TPU v5e con otto chip. Puoi specificare un tipo e una versione di acceleratore diversi. Per saperne di più, consulta Versioni TPU.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Creare una Cloud TPU utilizzando l'API Create Node
Puoi creare una Cloud TPU utilizzando gcloud, la Google Cloud console,
o l'API Cloud TPU.
Quando crei una Cloud TPU, specifica la versione software della TPU (chiamata anche versione runtime). Per determinare la versione software da utilizzare, consulta Versioni software TPU.
Inoltre, specifica il numero di TensorCore o chip TPU per la configurazione TPU che stai utilizzando. Per saperne di più, consulta la sezione relativa alla tua versione TPU in Architettura di sistema.
gcloud
Utilizza il gcloud compute tpus tpu-vm create
comando per creare una TPU utilizzando l'API Create Node. Consulta
Indirizzi IP esterni e interni
per configurare indirizzi IP interni o esterni specifici.
Il seguente comando crea una VM TPU v5e con 8 chip TPU:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Descrizioni dei flag dei comandi
zone- La zona in cui crei la Cloud TPU.
accelerator-type- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che crei. Per saperne di più sui tipi di acceleratore supportati per ogni versione TPU, consulta Versioni TPU.
version- La versione software TPU.
Console
Queste istruzioni creano una VM TPU v5e con 8 chip TPU:
Nella Google Cloud console, vai alla pagina TPU:
Fai clic su Crea TPU.
Nel campo Nome, inserisci un nome per la TPU.
Nel campo Zona, seleziona la zona in cui crei la TPU.
Nel campo Tipo di TPU, seleziona un tipo di acceleratore. Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che crei. Per saperne di più sui tipi di acceleratore supportati per ogni versione TPU, consulta Versioni TPU.
Nel campo Versione software TPU, seleziona una versione software. Quando crei una VM Cloud TPU, la versione software TPU specifica la versione del runtime TPU da installare. Per saperne di più, consulta Versioni software TPU.
Fai clic su Crea per creare le risorse.
curl
Il seguente comando utilizza curl per creare una VM TPU v5e con 8 chip TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Campi obbligatori
runtime_version- La versione runtime di Cloud TPU che utilizzi.
project-id- Il nome del tuo progetto registrato Google Cloud .
zone- La zona in cui crei la Cloud TPU.
node_name- Il nome della VM TPU che crei.
Java
Questo esempio di codice crea una VM TPU v5e con 8 chip TPU utilizzando l'API Cloud TPU in Java.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questo esempio di codice crea una VM TPU v5e con 8 chip TPU utilizzando l'API Cloud TPU in Node.js.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Questo esempio di codice crea una VM TPU v5e con 8 chip TPU utilizzando l'API Cloud TPU in Python.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Eseguire uno script di avvio
Per eseguire uno script di avvio sulla VM TPU, specifica il flag --metadata startup-script quando crei la VM TPU.
gcloud
Questo comando crea una VM TPU e specifica uno script di avvio.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
Questo esempio di codice crea una VM TPU e specifica uno script di avvio in Java.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questo esempio di codice crea una VM TPU e specifica uno script di avvio in Node.js.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Questo esempio di codice crea una VM TPU e specifica uno script di avvio in Python.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Passaggi successivi
- Scopri di più sulle risorse in coda.
- Scopri come gestire le VM TPU.
- Scopri di più sulle TPU in GKE.
- Scopri come eseguire il codice JAX su una VM TPU.
- Scopri come eseguire il codice PyTorch su una TPU VM.
- Scopri come eseguire un carico di lavoro di ML sulle TPU, ad esempio, pubblicare Qwen2-72B-Instruct con vLLM sulle TPU.