Membuat VM Cloud TPU
Anda membuat VM TPU menggunakan Create Node API, queued resources API, atau Google Kubernetes Engine (GKE).
Anda memanggil Create Node API saat menjalankan gcloud compute tpus tpu-vm create
perintah menggunakan Google Cloud CLI dan saat membuat VM TPU menggunakan
Google Cloud konsol. Saat Anda menggunakan Create Node API, sistem akan segera memproses permintaan Anda. Jika tidak ada kapasitas yang cukup untuk memenuhi permintaan Anda, permintaan akan gagal.
Sebaiknya buat VM TPU menggunakan queued resources API. Saat Anda membuat VM TPU menggunakan queued resource API, layanan Cloud TPU akan menambahkan permintaan queued resource Anda ke antrean yang dikelola oleh layanan. Saat resource yang diminta tersedia, layanan akan menetapkannya ke project Google Cloud Anda untuk penggunaan langsung dan eksklusif. Untuk mengetahui informasi selengkapnya, lihat Mengelola queued resource.
Jika Anda ingin menggunakan Google Kubernetes Engine (GKE) untuk mengelola resource TPU, pertama-tama, buat cluster GKE. Kemudian, tambahkan node pool yang berisi slice TPU ke cluster Anda. Untuk mengetahui informasi selengkapnya, lihat Tentang TPU di GKE.
Prasyarat
Lengkapi prasyarat berikut:
Buat Google Cloud project untuk TPU Anda seperti yang dijelaskan dalam Menyiapkan Google Cloud project untuk TPU.
Tentukan persyaratan TPU Anda seperti yang dijelaskan dalam Merencanakan resource Cloud TPU.
Jika Anda menggunakan salah satu Library Klien Cloud, ikuti petunjuk penyiapan untuk bahasa yang Anda gunakan:
Tetapkan variabel lingkungan untuk membuat TPU v5e dengan delapan chip. Contoh berikut menggunakan TPU v5e dengan delapan chip. Anda dapat menentukan jenis dan versi akselerator yang berbeda. Lihat Versi TPU untuk mengetahui informasi selengkapnya.
export TPU_NAME=your-tpu-name export PROJECT_ID=your-project export ZONE=us-central1-a export ACCELERATOR_TYPE=v5litepod-8 export VERSION=v2-alpha-tpuv5-lite
Membuat Cloud TPU menggunakan Create Node API
Anda membuat Cloud TPU menggunakan gcloud, konsol Google Cloud ,
atau Cloud TPU API.
Saat membuat Cloud TPU, tentukan versi software TPU (juga disebut versi runtime). Untuk menentukan versi software yang akan digunakan, lihat Versi software TPU.
Selain itu, tentukan jumlah TensorCore atau chip TPU untuk konfigurasi TPU yang Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat bagian untuk versi TPU Anda di Arsitektur sistem.
gcloud
Gunakan gcloud compute tpus tpu-vm create
perintah untuk membuat TPU menggunakan Create Node API. Lihat
Alamat IP eksternal dan internal
untuk mengonfigurasi alamat IP internal atau eksternal tertentu.
Perintah berikut membuat VM TPU v5e dengan 8 chip TPU:
gcloud compute tpus tpu-vm create $TPU_NAME \ --project=$PROJECT_ID --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION
Deskripsi flag perintah
gcloudKonsol
Petunjuk ini membuat VM TPU v5e dengan 8 chip TPU:
Di Google Cloud konsol, buka halaman TPU:
Klik Create TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kolom Zone, pilih zona tempat Anda membuat TPU.
Di kolom TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
Di kolom TPU software version, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.
Klik Create untuk membuat resource Anda.
curl
Perintah berikut menggunakan curl untuk membuat VM TPU v5e dengan 8 chip TPU.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" -d "{accelerator_type: $ACCELERATOR_TYPE, \ runtime_version:'$VERSION', \ network_config: {enable_external_ips: true}, \ shielded_instance_config: { enable_secure_boot: true }}" \ https://tpu.googleapis.com/v2/projects/$PROJECT_ID/locations/$ZONE/nodes?node_id=$TPU_NAME
Kolom wajib diisi
runtime_version- Versi runtime Cloud TPU yang Anda gunakan.
project-id- Nama project Anda yang terdaftar. Google Cloud
zone- Zona tempat Anda membuat Cloud TPU.
node_name- Nama VM TPU yang Anda buat.
Java
Contoh kode ini membuat VM TPU v5e dengan 8 chip TPU menggunakan Cloud TPU API di Java.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Contoh kode ini membuat VM TPU v5e dengan 8 chip TPU menggunakan Cloud TPU API di Node.js.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Contoh kode ini membuat VM TPU v5e dengan 8 chip TPU menggunakan Cloud TPU API di Python.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menjalankan skrip startup
Anda menjalankan skrip startup di VM TPU dengan menentukan flag --metadata startup-script saat membuat VM TPU.
gcloud
Perintah ini membuat VM TPU dan menentukan skrip startup.
gcloud compute tpus tpu-vm create $TPU_NAME \ --zone=$ZONE \ --accelerator-type=$ACCELERATOR_TYPE \ --version=$VERSION \ --metadata startup-script='#! /bin/bash pip3 install numpy EOF'
Java
Contoh kode ini membuat VM TPU dan menentukan skrip startup di Java.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Contoh kode ini membuat VM TPU dan menentukan skrip startup di Node.js.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Contoh kode ini membuat VM TPU dan menentukan skrip startup di Python.
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Langkah berikutnya
- Pelajari queued resource.
- Pelajari cara mengelola VM TPU.
- Pelajari TPU di GKE.
- Pelajari cara menjalankan kode JAX di VM TPU.
- Pelajari cara menjalankan kode PyTorch di TPU VM.
- Pelajari cara menjalankan workload ML di TPU, misalnya, Menyajikan Qwen2-72B-Instruct dengan vLLM di TPU.