Crea VM Cloud TPU
Crea VM TPU utilizzando l'API Create Node, l'API queued resources o Google Kubernetes Engine (GKE).
Chiami l'API Create Node quando esegui il comando gcloud compute tpus tpu-vm create
utilizzando Google Cloud CLI e quando crei una VM TPU utilizzando la
consoleGoogle Cloud . Quando utilizzi l'API Create Node, il sistema elabora la tua
richiesta immediatamente. Se la capacità non è sufficiente per soddisfare la richiesta,
la richiesta non va a buon fine.
Ti consigliamo di creare VM TPU utilizzando l'API per le risorse in coda. Quando crei una VM TPU utilizzando l'API delle risorse in coda, il servizio Cloud TPU aggiunge la richiesta di risorse in coda a una coda gestita dal servizio. Quando la risorsa richiesta diventa disponibile, il servizio la assegna al tuo progetto Google Cloud per il tuo utilizzo immediato ed esclusivo. Per maggiori informazioni, vedi Gestire le risorse in coda.
Se vuoi utilizzare Google Kubernetes Engine (GKE) per gestire le risorse TPU, crea prima un cluster GKE. Quindi, aggiungi al cluster pool di nodi contenenti slice TPU. Per maggiori informazioni, consulta Informazioni sulle TPU in GKE.
Prerequisiti
Completa i seguenti prerequisiti:
Crea un Google Cloud progetto per le tue TPU come descritto in Configurare un Google Cloud progetto per le TPU.
Determina i requisiti della TPU come descritto in Pianificare le risorse Cloud TPU.
Se utilizzi una delle librerie client di Cloud, segui le istruzioni di configurazione per la lingua che utilizzi:
Imposta le variabili di ambiente per creare una TPU v5e con otto chip. Gli esempi seguenti utilizzano una TPU v5e con otto chip. Puoi specificare un tipo e una versione di acceleratore diversi. Per saperne di più, consulta la sezione Versioni TPU.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Crea una Cloud TPU utilizzando l'API Create Node
Crea una Cloud TPU utilizzando gcloud, la console Google Cloud o l'API Cloud TPU.
Quando crei una Cloud TPU, specifica la versione software della TPU (chiamata anche versione runtime). Per determinare quale versione software utilizzare, consulta Versioni software TPU.
Specifica anche il numero di Tensor Core o chip TPU per la configurazione TPU che stai utilizzando. Per maggiori informazioni, consulta la sezione relativa alla tua versione di TPU in Architettura di sistema.
gcloud
Utilizza il comando gcloud compute tpus tpu-vm create per creare una TPU utilizzando l'API Create Node. Consulta Indirizzi IP esterni e interni per configurare indirizzi IP interni o esterni specifici.
Il seguente comando crea una VM TPU v5e con 8 chip TPU:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Descrizioni dei flag dei comandi
zone- La zona in cui crei la tua Cloud TPU.
accelerator-type- Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che crei. Per ulteriori informazioni sui tipi di acceleratore supportati per ogni versione di TPU, consulta Versioni di TPU.
version- La versione del software TPU.
Console
Queste istruzioni creano una VM TPU v5e con 8 chip TPU:
Nella console Google Cloud , vai alla pagina TPU:
Fai clic su Crea TPU.
Nel campo Nome, inserisci un nome per la TPU.
Nel campo Zona, seleziona la zona in cui creare la TPU.
Nel campo Tipo di TPU, seleziona un tipo di acceleratore. Il tipo di acceleratore specifica la versione e le dimensioni della Cloud TPU che crei. Per ulteriori informazioni sui tipi di acceleratore supportati per ogni versione di TPU, consulta Versioni di TPU.
Nel campo Versione software TPU, seleziona una versione software. Quando crei una VM Cloud TPU, la versione del software TPU specifica la versione del runtime TPU da installare. Per maggiori informazioni, vedi Versioni software TPU.
Fai clic su Crea per creare le risorse.
curl
Il seguente comando utilizza curl per creare una VM TPU v5e con 8 chip TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Campi obbligatori
runtime_version- La versione runtime di Cloud TPU che utilizzi.
project-id- Il nome del progetto Google Cloud registrato.
zone- La zona in cui crei la Cloud TPU.
node_name- Il nome della VM TPU che crei.
Java
Questo esempio di codice crea una VM TPU v5e con 8 chip TPU utilizzando l'API Cloud TPU in Java.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questo esempio di codice crea una VM TPU v5e con 8 chip TPU utilizzando l'API Cloud TPU in Node.js.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Questo esempio di codice crea una VM TPU v5e con 8 chip TPU utilizzando l'API Cloud TPU in Python.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Esegui uno script di avvio
Esegui uno script di avvio sulla tua VM TPU specificando il flag --metadata startup-script quando crei la VM TPU.
gcloud
Questo comando crea una VM TPU e specifica uno script di avvio.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
Questo esempio di codice crea una VM TPU e specifica uno script di avvio in Java.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questo esempio di codice crea una VM TPU e specifica uno script di avvio in Node.js.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Questo esempio di codice crea una VM TPU e specifica uno script di avvio in Python.
Per eseguire l'autenticazione in Cloud TPU, configura le Credenziali predefinite dell'applicazione. Per saperne di più, consulta Configura l'autenticazione per un ambiente di sviluppo locale.
Passaggi successivi
- Scopri di più sulle risorse in coda.
- Scopri come gestire le VM TPU.
- Scopri di più sulle TPU in GKE.
- Scopri come eseguire il codice JAX su una VM TPU.
- Scopri come eseguire il codice PyTorch su una VM TPU.
- Scopri come eseguire un workload ML sulle TPU, ad esempio Eroga Qwen2-72B-Instruct con vLLM sulle TPU.