Cloud TPU-VMs erstellen
Sie erstellen TPU-VMs mit der Create Node API, der API für in die Warteschlange gestellte Ressourcen oder Google Kubernetes Engine (GKE).
Sie rufen die Create Node API auf, wenn Sie den gcloud compute tpus tpu-vm create
Befehl mit der Google Cloud CLI ausführen und wenn Sie eine TPU-VM über die
Google Cloud Console erstellen. Wenn Sie die Create Node API verwenden, verarbeitet das System Ihre Anfrage sofort. Wenn nicht genügend Kapazität verfügbar ist, um Ihre Anfrage zu erfüllen, schlägt die Anfrage fehl.
Wir empfehlen, TPU-VMs mit der API für in die Warteschlange gestellte Ressourcen zu erstellen. Wenn Sie eine TPU-VM mit der API für in die Warteschlange gestellte Ressourcen erstellen, fügt der Cloud TPU-Dienst Ihre Anfrage für in die Warteschlange gestellte Ressourcen einer Warteschlange hinzu, die vom Dienst verwaltet wird. Sobald die angeforderte Ressource verfügbar ist, weist der Dienst sie Ihrem Google Cloud Projekt zu und steht Ihnen sofort zur exklusiven Nutzung zur Verfügung. Weitere Informationen finden Sie unter In die Warteschlange gestellte Ressourcen verwalten.
Wenn Sie Google Kubernetes Engine (GKE) zum Verwalten von TPU-Ressourcen verwenden möchten, erstellen Sie zuerst einen GKE-Cluster. Fügen Sie dann Ihrem Cluster Knotenpools mit TPU-Slices hinzu. Weitere Informationen finden Sie unter TPUs in GKE.
Vorbereitung
Erfüllen Sie die folgenden Voraussetzungen:
Erstellen Sie ein Google Cloud Projekt für Ihre TPUs, wie unter Projekt für TPUs einrichten beschrieben. Google Cloud
Bestimmen Sie Ihre TPU-Anforderungen, wie unter Cloud TPU-Ressourcen planen beschrieben.
Wenn Sie eine der Cloud-Clientbibliotheken verwenden, folgen Sie der Einrichtungsanleitung für die verwendete Sprache:
Legen Sie Umgebungsvariablen fest, um eine v5e-TPU mit acht Chips zu erstellen. In den folgenden Beispielen wird eine v5e-TPU mit acht Chips verwendet. Sie können einen anderen Beschleunigertyp und eine andere Version angeben. Weitere Informationen finden Sie unter TPU-Versionen.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Cloud TPU mit der Create Node API erstellen
Sie erstellen eine Cloud TPU mit gcloud, der Google Cloud Console,
oder der Cloud TPU API.
Beim Erstellen einer Cloud TPU müssen Sie die TPU-Softwareversion (auch als Laufzeitversion bezeichnet) angeben. Informationen dazu, welche Softwareversion Sie verwenden sollten, finden Sie unter TPU-Softwareversionen.
Geben Sie außerdem die Anzahl der TensorCores oder TPU-Chips für die verwendete TPU-Konfiguration an. Weitere Informationen finden Sie im Abschnitt für Ihre TPU-Version in Systemarchitektur.
gcloud
Verwenden Sie den gcloud compute tpus tpu-vm create
Befehl, um eine TPU mit der Create Node API zu erstellen. Unter
Externe und interne IP-Adressen
können Sie bestimmte interne oder externe IP-Adressen konfigurieren.
Mit dem folgenden Befehl wird eine v5e-TPU-VM mit 8 TPU-Chips erstellt:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Beschreibungen der Befehls-Flags
zone- Die Zone, in der Sie die Cloud TPU erstellen.
accelerator-type- Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
version- Die Version der TPU-Software .
Console
Mit dieser Anleitung wird eine v5e-TPU-VM mit 8 TPU-Chips erstellt:
Rufen Sie in der Google Cloud Console die TPUs Seite auf:
Klicken Sie auf TPU erstellen.
Geben Sie im Feld Name einen Namen für die TPU ein.
Wählen Sie im Feld Zone die Zone aus, in der Sie die TPU erstellen möchten.
Wählen Sie im Feld TPU-Typ einen Beschleunigertyp aus. Der Beschleunigertyp gibt die Version und Größe der Cloud TPU an, die Sie erstellen. Weitere Informationen zu den unterstützten Beschleunigertypen für die einzelnen TPU-Versionen finden Sie unter TPU-Versionen.
Wählen Sie im Feld Version der TPU-Software eine Softwareversion aus. Beim Erstellen einer Cloud TPU-VM gibt das Feld „Version der TPU-Software“ die Version der zu installierenden TPU-Laufzeit an. Weitere Informationen finden Sie unter TPU-Softwareversionen.
Klicken Sie auf Erstellen, um Ihre Ressourcen zu erstellen.
curl
Mit dem folgenden Befehl wird curl verwendet, um eine v5e-TPU-VM mit 8 TPU-Chips zu erstellen.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Pflichtfelder
runtime_version- Die Version der Cloud TPU-Laufzeit, die Sie verwenden.
project-id- Der Name Ihres registrierten Google Cloud Projekts in.
zone- Die Zone in der Sie die Cloud TPU erstellen.
node_name- Der Name der TPU-VM, die Sie erstellen.
Java
In diesem Codebeispiel wird eine v5e-TPU-VM mit 8 TPU-Chips mit der Cloud TPU API in Java erstellt.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
In diesem Codebeispiel wird eine v5e-TPU-VM mit 8 TPU-Chips mit der Cloud TPU API in Node.js erstellt.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
In diesem Codebeispiel wird eine v5e-TPU-VM mit 8 TPU-Chips mit der Cloud TPU API in Python erstellt.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Startscript ausführen
Sie führen ein Startscript auf Ihrer TPU-VM aus, indem Sie beim Erstellen der TPU-VM das Flag --metadata startup-script angeben.
gcloud
Mit diesem Befehl wird eine TPU-VM erstellt und ein Startscript angegeben.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
In diesem Codebeispiel wird eine TPU-VM erstellt und ein Startscript in Java angegeben.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Node.js
In diesem Codebeispiel wird eine TPU-VM erstellt und ein Startscript in Node.js angegeben.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Python
In diesem Codebeispiel wird eine TPU-VM erstellt und ein Startscript in Python angegeben.
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Cloud TPU zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.
Nächste Schritte
- Informationen zu Ressourcen in der Warteschlange
- Erfahren Sie, wie Sie TPU-VMs verwalten.
- TPUs in GKE
- Erfahren Sie, wie Sie JAX-Code auf einer TPU-VM ausführen.
- PyTorch-Code auf einer TPU VM ausführen
- ML-Arbeitslast auf TPUs ausführen, z. B. Qwen2-72B-Instruct mit vLLM auf TPUs bereitstellen.