Membuat VM Cloud TPU
Anda membuat VM TPU menggunakan Create Node API, API resource dalam antrean, atau Google Kubernetes Engine (GKE).
Anda memanggil Create Node API saat menjalankan perintah gcloud compute tpus tpu-vm create menggunakan Google Cloud CLI dan saat membuat VM TPU menggunakan konsolGoogle Cloud . Saat Anda menggunakan Create Node API, sistem akan segera memproses permintaan Anda. Jika kapasitas tidak cukup untuk memenuhi permintaan Anda, permintaan akan gagal.
Sebaiknya buat VM TPU menggunakan API resource dalam antrean. Saat Anda membuat VM TPU menggunakan API resource dalam antrean, layanan Cloud TPU akan menambahkan permintaan resource dalam antrean Anda ke antrean yang dikelola layanan. Saat resource yang diminta tersedia, layanan akan menetapkannya ke project Anda untuk penggunaan langsung dan eksklusif Anda. Google Cloud Untuk mengetahui informasi selengkapnya, lihat Mengelola resource dalam antrean.
Jika Anda ingin menggunakan Google Kubernetes Engine (GKE) untuk mengelola resource TPU, buat cluster GKE terlebih dahulu. Kemudian, tambahkan node pool yang berisi slice TPU ke cluster Anda. Untuk mengetahui informasi selengkapnya, lihat Tentang TPU di GKE.
Prasyarat
Selesaikan prasyarat berikut:
Buat project Google Cloud untuk TPU Anda seperti yang dijelaskan dalam Menyiapkan project Google Cloud untuk TPU.
Tentukan persyaratan TPU Anda seperti yang dijelaskan dalam Merencanakan resource Cloud TPU.
Jika Anda menggunakan salah satu Library Klien Cloud, ikuti petunjuk penyiapan untuk bahasa yang Anda gunakan:
Tetapkan variabel lingkungan untuk membuat TPU v5e dengan delapan chip. Contoh berikut menggunakan TPU v5e dengan delapan chip. Anda dapat menentukan jenis dan versi akselerator yang berbeda. Lihat versi TPU untuk mengetahui informasi selengkapnya.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Membuat Cloud TPU menggunakan Create Node API
Anda membuat Cloud TPU menggunakan gcloud, konsol Google Cloud , atau Cloud TPU API.
Saat membuat Cloud TPU, tentukan versi software TPU (juga disebut versi runtime). Untuk menentukan versi software yang akan digunakan, lihat Versi software TPU.
Selain itu, tentukan jumlah TensorCore atau chip TPU untuk konfigurasi TPU yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat bagian untuk versi TPU Anda di Arsitektur sistem.
gcloud
Gunakan perintah gcloud compute tpus tpu-vm create
untuk membuat TPU menggunakan Create Node API. Lihat
Alamat IP eksternal dan internal
untuk mengonfigurasi alamat IP internal atau eksternal tertentu.
Perintah berikut akan membuat VM TPU v5e dengan 8 chip TPU:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Deskripsi tanda perintah
Konsol
Petunjuk ini membuat VM TPU v5e dengan 8 chip TPU:
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kolom Zone, pilih zona tempat Anda membuat TPU.
Di kolom TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
Di kolom Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.
Klik Buat untuk membuat resource.
curl
Perintah berikut menggunakan curl untuk membuat VM TPU v5e dengan 8 chip TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Kolom wajib diisi
runtime_version- Versi runtime Cloud TPU yang Anda gunakan.
project-id- Nama project Google Cloud yang terdaftar.
zone- Zona tempat Anda membuat Cloud TPU.
node_name- Nama VM TPU yang Anda buat.
Java
Contoh kode ini membuat VM TPU v5e dengan 8 chip TPU menggunakan Cloud TPU API di Java.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Contoh kode ini membuat VM TPU v5e dengan 8 chip TPU menggunakan Cloud TPU API di Node.js.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Contoh kode ini membuat VM TPU v5e dengan 8 chip TPU menggunakan Cloud TPU API di Python.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menjalankan skrip startup
Anda menjalankan skrip startup di VM TPU dengan menentukan tanda
--metadata startup-script saat membuat VM TPU.
gcloud
Perintah ini membuat VM TPU dan menentukan skrip startup.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
Contoh kode ini membuat VM TPU dan menentukan skrip startup di Java.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Contoh kode ini membuat VM TPU dan menentukan skrip startup di Node.js.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Contoh kode ini membuat VM TPU dan menentukan skrip startup di Python.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Langkah berikutnya
- Pelajari resource dalam antrean.
- Pelajari cara mengelola VM TPU.
- Pelajari TPU di GKE.
- Pelajari cara menjalankan kode JAX di VM TPU.
- Pelajari cara menjalankan kode PyTorch di VM TPU.
- Pelajari cara menjalankan workload ML di TPU, misalnya, Menyajikan Qwen2-72B-Instruct dengan vLLM di TPU.