Dokumen ini menjelaskan cara mengidentifikasi workload yang kurang dan terlalu banyak disediakan yang berjalan di cluster Google Kubernetes Engine (GKE) menggunakan insight dan rekomendasi. Setelah memverifikasi bahwa workload yang diidentifikasi akan mendapatkan manfaat dari rekomendasi untuk meningkatkan atau menurunkan skala, Anda dapat melakukan perubahan yang direkomendasikan untuk menghemat biaya atau meningkatkan keandalan workload Anda. Jika memungkinkan, rekomendasi mencakup perkiraan penghematan atau biaya bulanan. Untuk mengetahui informasi selengkapnya, lihat Memahami perkiraan biaya atau penghematan.
GKE memberikan insight ini tentang workload yang berjalan di cluster Autopilot dan Standard. GKE juga memberikan rekomendasi serupa untuk seluruh cluster. Untuk mengetahui informasi selengkapnya, lihat Mengidentifikasi cluster GKE yang kurang dan terlalu banyak disediakan.
GKE memantau cluster Anda dan memberikan panduan untuk mengoptimalkan penggunaan Anda melalui Active Assist, sebuah layanan yang menyediakan pemberi rekomendasi yang menghasilkan insight dan rekomendasi untuk menggunakan resource di Google Cloud. Untuk mengetahui informasi selengkapnya tentang cara mengelola insight dan rekomendasi, lihat Mengoptimalkan penggunaan GKE dengan insight dan rekomendasi.
Mendapatkan insight dan rekomendasi untuk workload yang kurang dan kelebihan alokasi
GKE menampilkan insight dan rekomendasi ini di lokasi berikut di konsol Google Cloud setelah mengamati perilaku spesifik yang dibahas di bagian berikut:
- Halaman Workloads
- Hub FinOps
Rekomendasi ini memiliki judul berikut di halaman Workloads:
- Workload yang kelebihan alokasi: "Kurangi permintaan resource untuk mengurangi biaya"
- Workload yang kurang disediakan: "Tingkatkan permintaan resource untuk meningkatkan keandalan"
Anda juga dapat menerima semua jenis insight dan rekomendasi melalui Google Cloud CLI atau Recommender API. Untuk menemukan jenis ini secara khusus,
ikuti petunjuk untuk melihat insight dan
rekomendasi
serta memfilter menggunakan subjenis WORKLOAD_UNDERPROVISIONED dan WORKLOAD_OVERPROVISIONED.
Setelah mengidentifikasi workload yang kurang atau terlalu banyak disediakan, lihat pertimbangan saat menyesuaikan ukuran workload.
Cara GKE mengidentifikasi workload yang kurang dan kelebihan alokasi
Tabel berikut menjelaskan sinyal yang digunakan GKE untuk mengidentifikasi beban kerja yang kurang dan kelebihan alokasi yang dapat di-scale up atau down, serta batas untuk setiap sinyal. Selain itu, tabel ini menunjukkan tindakan yang sebaiknya Anda lakukan dalam skenario ini.
| Subjenis | Sinyal | Periode observasi | Detail | Rekomendasi |
|---|---|---|---|---|
WORKLOAD_UNDERPROVISIONED |
Penggunaan CPU atau memori tinggi | 15 hari terakhir | Beban kerja dianggap kurang memadai jika penggunaan CPU atau memori lebih dari 150% selama setidaknya 10% dari waktu selama 15 hari terakhir. | Menskalakan beban kerja untuk meningkatkan keandalan |
WORKLOAD_OVERPROVISIONED |
Penggunaan CPU atau memori rendah | 15 hari terakhir | Workload disediakan secara berlebih jika penggunaan CPU atau memori kurang dari 50% setidaknya selama 90% waktu dalam 15 hari terakhir. | Menurunkan skala beban kerja untuk menghemat biaya |
GKE juga menggunakan panduan berikut untuk menentukan waktu memberikan insight dan rekomendasi:
- GKE tidak membuat rekomendasi untuk metrik target penskalaan otomatis Pod horizontal (HPA) karena penggunaan metrik ini dapat menyebabkan interferensi.
- Jika penskalaan otomatis Pod vertikal (VPA) diaktifkan, nilai permintaan akan dikelola secara otomatis dan GKE tidak perlu membuat rekomendasi.
- GKE mungkin menunggu hingga tiga hari sebelum membuat rekomendasi untuk workload baru.
Memahami estimasi biaya atau penghematan
Jika memungkinkan, rekomendasi GKE mencakup perkiraan yang memproyeksikan biaya atau penghematan bulanan jika Anda menyesuaikan ukuran beban kerja. Estimasi ini berasal dari biaya workload, berdasarkan rata-rata tertimbang dari nilai permintaan yang digabungkan dengan biaya CPU dan memori workload selama 30 hari terakhir.
Setiap perkiraan biaya atau penghematan adalah proyeksi berdasarkan pembelanjaan sebelumnya, dan bukan jaminan biaya atau penghematan di masa mendatang.
Untuk melihat perkiraan ini, pastikan hal berikut benar:
- Anda memiliki izin
billing.accounts.getSpendingInformationyang diperlukan untuk mendapatkan informasi pembelanjaan. Untuk mengetahui informasi selengkapnya, lihat Akses Penagihan Cloud. - Alokasi biaya GKE diaktifkan untuk cluster. Untuk mengetahui informasi selengkapnya, lihat Mengaktifkan alokasi biaya GKE.
Untuk mengetahui informasi selengkapnya tentang biaya semua cluster GKE Anda, termasuk perincian yang lebih terperinci berdasarkan namespace dan workload, lihat Mendapatkan insight pembelanjaan utama untuk alokasi resource dan biaya cluster GKE Anda.
Untuk mengetahui informasi selengkapnya tentang biaya menjalankan cluster GKE, lihat harga GKE.
Pertimbangan saat menyesuaikan ukuran workload
Sebelum Anda mengikuti rekomendasi untuk menskalakan workload ke atas atau ke bawah, pertimbangkan hal berikut:
- Tinjau pemakaian resource workload untuk melihat performanya, dan apakah workload menggunakan lebih banyak atau lebih sedikit CPU dan memori dari yang diharapkan. Untuk mengetahui petunjuknya, lihat Menganalisis permintaan resource.
- Workload batch processing mungkin sengaja mempertahankan pemanfaatan yang tinggi untuk efisiensi biaya. Jika resource yang dialokasikan sudah cukup untuk tugas batch, Anda tidak perlu menskalakan workload yang sangat banyak digunakan, yang diidentifikasi sebagai kurang penyediaan.
- GKE memiliki visibilitas terbatas ke penggunaan memori aktual beban kerja berbasis Java Virtual Machine (JVM). Lakukan pemeriksaan ekstra sebelum menerapkan rekomendasi untuk jenis workload ini.
Menerapkan rekomendasi untuk menyesuaikan ukuran beban kerja
Anda dapat menyesuaikan ukuran beban kerja agar lebih sesuai dengan pemanfaatan resource beban kerja dengan melakukan salah satu hal berikut:
- Aktifkan penskalaan otomatis Pod vertikal untuk beban kerja. Untuk mengetahui informasi selengkapnya, lihat Menetapkan permintaan resource Pod secara otomatis.
Ubah permintaan dan batas secara manual sesuai dengan rekomendasi:
- Workload yang kurang disediakan: Untuk menerapkan rekomendasi guna menyesuaikan ukuran workload yang kurang disediakan, tingkatkan permintaan dan batas resource untuk workload tersebut. Saat menerapkan rekomendasi ini, Anda membantu memastikan bahwa workload Anda tetap andal karena memiliki jumlah resource yang sesuai untuk aplikasinya.
- Workload yang disediakan berlebih: untuk menerapkan rekomendasi penyesuaian ukuran workload yang disediakan berlebih, kurangi permintaan dan batas resource untuk workload tersebut. Sesuaikan alokasi CPU dan memori cluster agar sesuai dengan kebutuhan beban kerja Anda. Saat menerapkan rekomendasi ini, Anda membantu memastikan bahwa Anda hanya menggunakan resource yang diperlukan untuk menjalankan workload.
Langkah berikutnya
- Melihat metrik pengoptimalan terkait biaya
- Mengurangi biaya dengan memperkecil skala cluster GKE di luar jam sibuk
- Mengoptimalkan penggunaan GKE dengan insight dan rekomendasi
- Praktik terbaik untuk menjalankan aplikasi Kubernetes hemat biaya di GKE
- 5 fitur GKE untuk membantu Anda mengoptimalkan cluster