Dokumen ini menjelaskan cara menskalakan workload stateless yang ada yang berjalan di cluster Kubernetes terisolasi Google Distributed Cloud (GDC). Anda harus menskalakan pod yang berjalan di workload stateless saat persyaratan workload container Anda berkembang.
Dokumen ini ditujukan bagi developer dalam grup operator aplikasi yang bertanggung jawab untuk mengelola workload aplikasi bagi organisasi mereka. Untuk mengetahui informasi selengkapnya, lihat dokumentasi Audiens untuk GDC yang terisolasi dari internet.
Sebelum memulai
Untuk menjalankan perintah terhadap cluster Kubernetes, pastikan Anda memiliki resource berikut:
Temukan nama cluster Kubernetes, atau tanyakan kepada Administrator Platform Anda nama cluster tersebut.
Login dan buat file kubeconfig untuk cluster Kubernetes jika Anda belum memilikinya.
Gunakan jalur kubeconfig cluster Kubernetes untuk mengganti
KUBERNETES_CLUSTER_KUBECONFIGdalam petunjuk ini.
Untuk mendapatkan izin yang diperlukan guna menskalakan workload stateless, minta Admin IAM Organisasi Anda untuk memberi Anda peran Admin Namespace (namespace-admin) di namespace project Anda.
Menskalakan deployment
Manfaatkan fungsi penskalaan Kubernetes untuk menskalakan jumlah pod yang berjalan dalam deployment Anda dengan tepat.
Menskalakan pod deployment secara otomatis
Kubernetes menawarkan penskalaan otomatis untuk menghilangkan kebutuhan memperbarui deployment secara manual saat permintaan berubah. Tetapkan penskalaan otomatis pod horizontal di deployment Anda untuk mengaktifkan fitur ini:
kubectl --kubeconfig KUBERNETES_CLUSTER_KUBECONFIG \
-n NAMESPACE \
autoscale deployment DEPLOYMENT_NAME \
--cpu-percent=CPU_PERCENT \
--min=MIN_NUMBER_REPLICAS \
--max=MAX_NUMBER_REPLICAS
Ganti kode berikut:
KUBERNETES_CLUSTER_KUBECONFIG: file kubeconfig untuk cluster.NAMESPACE: namespace project.DEPLOYMENT_NAME: nama deployment yang akan diskala otomatis.CPU_PERCENT: target pemakaian CPU rata-rata yang akan diminta, dinyatakan sebagai persentase, di semua pod.MIN_NUMBER_REPLICAS: batas bawah untuk jumlah pod yang dapat disediakan oleh autoscaler.MAX_NUMBER_REPLICAS: batas atas untuk jumlah pod yang dapat disediakan oleh autoscaler.
Untuk memeriksa status terkini horizontal pod autoscaler yang baru dibuat, jalankan:
kubectl get hpa
Outputnya mirip dengan hal berikut ini:
NAME REFERENCE TARGET MINPODS MAXPODS REPLICAS AGE
DEPLOYMENT_NAME Deployment/DEPLOYMENT_NAME/scale 0% / 50% 1 10 1 18s
Menskalakan pod deployment secara manual
Jika Anda lebih suka menskalakan deployment secara manual, jalankan:
kubectl --kubeconfig KUBERNETES_CLUSTER_KUBECONFIG \
-n NAMESPACE \
scale deployment DEPLOYMENT_NAME \
--replicas NUMBER_OF_REPLICAS
Ganti kode berikut:
KUBERNETES_CLUSTER_KUBECONFIG: file kubeconfig untuk cluster.NAMESPACE: namespace project.DEPLOYMENT_NAME: nama deployment yang akan diskala otomatis.DEPLOYMENT_NAME: jumlah objekPodyang direplikasi yang diinginkan dalam deployment.