Cloud TPU-VMs erstellen
Sie erstellen TPU-VMs mit der Create Node API, der Queued Resources API oder Google Kubernetes Engine (GKE).
Sie rufen die Create Node API auf, wenn Sie den Befehl gcloud compute tpus tpu-vm create mit der Google Cloud CLI ausführen und wenn Sie eine TPU-VM über dieGoogle Cloud Console erstellen. Wenn Sie die Create Node API verwenden, wird Ihre Anfrage sofort verarbeitet. Wenn nicht genügend Kapazität verfügbar ist, um Ihre Anfrage zu erfüllen, schlägt die Anfrage fehl.
Wir empfehlen, TPU-VMs mit der API für in die Warteschlange gestellte Ressourcen zu erstellen. Wenn Sie eine TPU-VM mit der API für in die Warteschlange gestellte Ressourcen erstellen, fügt der Cloud TPU-Dienst Ihre Anfrage für in die Warteschlange gestellte Ressourcen einer vom Dienst verwalteten Warteschlange hinzu. Sobald die angeforderte Ressource verfügbar ist, wird sie Ihrem Projekt in Google Cloud zugewiesen und steht Ihnen sofort zur exklusiven Nutzung zur Verfügung. Weitere Informationen finden Sie unter In die Warteschlange gestellte Ressourcen verwalten.
Wenn Sie die Google Kubernetes Engine (GKE) zum Verwalten von TPU-Ressourcen verwenden möchten, müssen Sie zuerst einen GKE-Cluster erstellen. Anschließend fügen Sie Ihrem Cluster Knotenpools mit TPU-Slices hinzu. Weitere Informationen finden Sie unter TPUs in der GKE.
Vorbereitung
Erfüllen Sie die folgenden Voraussetzungen:
Erstellen Sie ein Google Cloud Projekt für Ihre TPUs, wie in Google Cloud -Projekt für TPUs einrichten beschrieben.
Ermitteln Sie Ihre TPU-Anforderungen, wie unter Cloud TPU-Ressourcen planen beschrieben.
Wenn Sie eine der Cloud-Clientbibliotheken verwenden, folgen Sie der Einrichtungsanleitung für die verwendete Sprache:
Legen Sie Umgebungsvariablen fest, um eine v5e-TPU mit acht Chips zu erstellen. In den folgenden Beispielen wird eine v5e-TPU mit acht Chips verwendet. Sie können einen anderen Beschleunigertyp und eine andere Beschleunigerversion angeben. Weitere Informationen finden Sie unter TPU-Versionen.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Cloud TPU mit der Create Node API erstellen
Sie können eine Cloud TPU mit gcloud, der Google Cloud Console oder der Cloud TPU API erstellen.
Geben Sie beim Erstellen einer Cloud TPU die TPU-Softwareversion (auch als Laufzeitversion bezeichnet) an. Informationen dazu, welche Softwareversion Sie verwenden sollten, finden Sie unter TPU-Softwareversionen.
Geben Sie außerdem die Anzahl der TensorCores oder TPU-Chips für die verwendete TPU-Konfiguration an. Weitere Informationen finden Sie im Abschnitt für Ihre TPU-Version unter Systemarchitektur.
gcloud
.Verwenden Sie den Befehl gcloud compute tpus tpu-vm create, um eine TPU mit der Create Node API zu erstellen. Unter Externe und interne IP-Adressen finden Sie Informationen zum Konfigurieren bestimmter interner oder externer IP-Adressen.
Mit dem folgenden Befehl wird eine v5e-TPU-VM mit 8 TPU-Chips erstellt:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Beschreibungen der Befehls-Flags
zone- Die Zone, in der Sie die Cloud TPU erstellen.
accelerator-type- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
version- Die Version der TPU-Software.
Console
Mit dieser Anleitung wird eine v5e-TPU-VM mit 8 TPU-Chips erstellt:
Rufen Sie in der Google Cloud Console die Seite TPUs auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für die TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld Version der TPU-Software eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt das Feld „Version der TPU-Software“ die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf Erstellen, um Ihre Ressourcen zu erstellen.
curl
Im folgenden Befehl wird curl verwendet, um eine v5e-TPU-VM mit 8 TPU-Chips zu erstellen.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Pflichtfelder
runtime_version- Die Version der Cloud TPU-Laufzeit, die Sie verwenden.
project-id- Der Name Ihres registrierten Projekts in Google Cloud .
zone- Die Zone, in der Sie die Cloud TPU erstellen.
node_name- Der Name der TPU-VM, die Sie erstellen.
Java
In diesem Codebeispiel wird eine v5e-TPU-VM mit 8 TPU-Chips mit der Cloud TPU API in Java erstellt.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
In diesem Codebeispiel wird eine v5e-TPU-VM mit 8 TPU-Chips mit der Cloud TPU API in Node.js erstellt.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
In diesem Codebeispiel wird eine v5e-TPU-VM mit 8 TPU-Chips mit der Cloud TPU API in Python erstellt.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Startscript ausführen
Sie führen ein Startskript auf Ihrer TPU-VM aus, indem Sie beim Erstellen der TPU-VM das Flag --metadata startup-script angeben.
gcloud
Mit diesem Befehl wird eine TPU-VM erstellt und ein Startskript angegeben.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
In diesem Codebeispiel wird eine TPU-VM erstellt und ein Startskript in Java angegeben.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
In diesem Codebeispiel wird eine TPU-VM erstellt und ein Startskript in Node.js angegeben.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
In diesem Codebeispiel wird eine TPU-VM erstellt und ein Startskript in Python angegeben.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Nächste Schritte
- Weitere Informationen zu Ressourcen, die in die Warteschlange gestellt wurden
- TPU-VMs verwalten
- TPUs in GKE
- Informationen zum Ausführen von JAX-Code auf einer TPU-VM
- PyTorch-Code auf einer TPU-VM ausführen
- Informationen zum Ausführen einer ML-Arbeitslast auf TPUs finden Sie beispielsweise unter Qwen2-72B-Instruct mit vLLM auf TPUs bereitstellen.