Anda dapat menggunakan Accelerated Processing Kit (XPK)
untuk membuat cluster Google Kubernetes Engine (GKE) yang telah dikonfigurasi sebelumnya untuk
workload berbasis Pathways. Anda juga dapat menggunakan gcloud untuk membuat cluster GKE secara manual untuk workload berbasis Pathways
Sebelum memulai
Pastikan Anda memiliki:
- Alat Kubernetes yang diinstal
- XPK yang diinstal
- TPU API yang diaktifkan
- Google Kubernetes Engine API yang diaktifkan
Menyiapkan lingkungan lokal Anda
Login dengan kredensial Anda. Google Cloud
gcloud auth application-default login
Tentukan variabel lingkungan berikut dengan nilai yang sesuai untuk workload Anda.
Variabel yang diperlukan
Membuat cluster GKE
Pada contoh berikut, Anda membuat cluster dengan dua node pool v5e 2x4.
Anda dapat membuat cluster menggunakan XPK atau perintah gcloud.
XPK
Tetapkan beberapa variabel lingkungan
CLUSTER_NODEPOOL_COUNT=CLUSTER_NODEPOOL_COUNT PROJECT=PROJECT_ID ZONE=ZONE CLUSTER=GKE_CLUSTER_NAME TPU_TYPE="v5litepod-8" PW_CPU_MACHINE_TYPE="n2-standard-64" NETWORK=NETWORK SUBNETWORK=SUB_NETWORK
Ganti kode berikut:
CLUSTER_NODEPOOL_COUNT: jumlah maksimum node pool yang dapat digunakan workloadPROJECT_ID: nama Google Cloud project AndaZONE: zona tempat Anda membuat resourceCLUSTER: nama cluster GKETPU_TYPE: jenis TPU. Untuk mengetahui informasi selengkapnya, lihat jenis yang didukung di XPKPW_CPU_MACHINE_TYPE: jenis node CPU untuk pengontrol PathwaysNETWORK: [Opsional] tetapkan nama Virtual Private Cloud jika menggunakan XPK, nama ini harus dibuat sebelum membuat cluster AndaSUBNETWORK: [Opsional] tetapkan nama subnetwork jika menggunakan XPK, nama ini harus dibuat sebelum membuat cluster Anda
Gunakan XPK untuk membuat cluster Pathways GKE. Perintah ini dapat memerlukan waktu beberapa menit untuk menyediakan kapasitas. Setelah selesai, kapasitas Anda akan dialokasikan dan Anda akan mulai dikenai biaya.
xpk cluster create-pathways \ --num-slices=${CLUSTER_NODEPOOL_COUNT} \ --tpu-type=${TPU_TYPE} \ --pathways-gce-machine-type=${PW_CPU_MACHINE_TYPE} \ --on-demand \ --project=${PROJECT} \ --zone=${ZONE} \ --cluster=${CLUSTER} \ --custom-cluster-arguments="--network=${NETWORK} --subnetwork=${SUBNETWORK} --enable-ip-alias"
Setelah cluster dibuat, Anda dapat membuat dan menghapus workload sesuai kebutuhan. Anda tidak perlu menyediakan ulang kapasitas TPU.
gcloud
Tetapkan beberapa variabel lingkungan
CLUSTER=GKE_CLUSTER_NAME PROJECT=PROJECT_ID ZONE=ZONE REGION=REGION CLUSTER_VERSION=GKE_CLUSTER_VERSION PW_CPU_MACHINE_TYPE="n2-standard-64" NETWORK=NETWORK SUBNETWORK=SUB_NETWORK CLUSTER_NODEPOOL_COUNT=3 TPU_MACHINE_TYPE="ct5lp-hightpu-4t" WORKERS_PER_SLICE=2 TOPOLOGY="2x4" NUM_CPU_NODES=1
Ganti kode berikut:
CLUSTER: nama cluster GKEPROJECT_ID: nama Google Cloud project AndaZONE: zona tempat Anda membuat resourceREGION: region tempat Anda membuat resourceCLUSTER_VERSION: [Opsional] versi cluster GKE, gunakan 1.32.2-gke.1475000 atau yang lebih baruPW_CPU_MACHINE_TYPE: jenis node CPU untuk pengontrol PathwaysNETWORK: [Opsional] tetapkan nama Virtual Private Cloud jika menggunakan XPK, nama ini harus dibuat sebelum membuat cluster AndaSUBNETWORK: [Opsional] tetapkan nama subnetwork jika menggunakan XPK, nama ini harus dibuat sebelum membuat cluster AndaCLUSTER_NODEPOOL_COUNT: jumlah maksimum node pool yang dapat digunakan workloadTPU_MACHINE_TYPE: jenis mesin TPU yang ingin Anda gunakanWORKERS_PER_SLICE: jumlah node per node poolGKE_ACCELERATOR_TYPE: jenis akselerator Google Kubernetes Engine, lihat Memilih versi TPUTOPOLOGY: topologi TPUNUM_CPU_NODES: ukuran node pool CPU Pathways
Langkah-langkah berikut menjelaskan cara membuat cluster GKE dan menyiapkan cluster untuk menjalankan workload Pathways.
Buat cluster GKE:
gcloud beta container clusters create ${CLUSTER} \ --project=${PROJECT} \ --zone=${ZONE} \ --cluster-version=${CLUSTER_VERSION} \ --scopes=storage-full,gke-default,cloud-platform \ --machine-type ${PW_CPU_MACHINE_TYPE} \ --network=${NETWORK} \ --subnetwork=${SUBNETWORK}Buat node pool TPU:
for i in $(seq 1 ${CLUSTER_NODEPOOL_COUNT}); do gcloud container node-pools create "tpu-np-${i}" \ --project=${PROJECT} \ --zone=${ZONE} \ --cluster=${CLUSTER} \ --machine-type=${TPU_MACHINE_TYPE} \ --num-nodes=${WORKERS_PER_SLICE} \ --placement-type=COMPACT \ --tpu-topology=${TOPOLOGY} \ --scopes=storage-full,gke-default,cloud-platform \ --workload-metadata=GCE_METADATA doneBuat node pool CPU:
gcloud container node-pools create "cpu-pathways-np" \ --project ${PROJECT} \ --zone ${ZONE} \ --cluster ${CLUSTER} \ --machine-type ${PW_CPU_MACHINE_TYPE} \ --num-nodes ${NUM_CPU_NODES} \ --scopes=storage-full,gke-default,cloud-platform \ --workload-metadata=GCE_METADATAInstal
JobSetdanPathwaysJobAPIDapatkan kredensial untuk cluster dan tambahkan ke konteks kubectl lokal Anda.
gcloud container clusters get-credentials ${CLUSTER} \ [--zone=${ZONE} | --region=${REGION}] \ --project=${PROJECT} \ && kubectl config set-context --current --namespace=defaultUntuk menggunakan arsitektur Pathways di cluster GKE, Anda harus menginstal
JobSetAPI danPathwaysJobAPI.kubectl apply --server-side -f https://github.com/kubernetes-sigs/jobset/releases/download/v0.8.0/manifests.yaml kubectl apply --server-side -f https://github.com/google/pathways-job/releases/download/v0.1.2/install.yaml
Langkah berikutnya
- Menjalankan workload batch dengan Pathways
- Mode interaktif Pathways
- Inferensi multihost dengan Pathways
- Pelatihan yang tangguh dengan Pathways
- Mengalihkan workload JAX ke Pathways
- Memecahkan masalah Pathways