Halaman ini menjelaskan cara memahami kondisi aplikasi dan mempertahankan ketersediaan serta keandalan aplikasi.
Fitur kemampuan observasi default
Secara default, cluster GKE dikonfigurasi untuk melakukan hal berikut:
- Mengirim log sistem, log audit, dan log aplikasi ke Cloud Logging.
- Mengirim metrik sistem ke Cloud Monitoring.
- Menggunakan Google Cloud Managed Service for Prometheus untuk mengumpulkan metrik pihak ketiga dan metrik buatan pengguna yang dikonfigurasi, lalu mengirimkannya ke Cloud Monitoring. Google Cloud Managed Service for Prometheus memungkinkan Anda memantau dan membuat pemberitahuan terkait workload menggunakan Prometheus, tanpa mengelola dan mengoperasikan Prometheus secara manual dalam skala besar.
Menyesuaikan dan meningkatkan pengumpulan data
Secara default, GKE membuat repositori Logging untuk menyimpan log setiap cluster. Anda dapat mengontrol log dan metrik mana yang dikirim dari cluster GKE ke Cloud Logging dan Cloud Monitoring.
Anda juga dapat mengontrol apakah akan mengaktifkan Google Cloud Managed Service for Prometheus.
Untuk cluster GKE Autopilot, Anda tidak dapat menonaktifkan integrasi Cloud Monitoring dan Cloud Logging.
Metrik kemampuan observasi tambahan
Anda dapat mengumpulkan metrik kemampuan observasi tambahan dengan mengaktifkan satu atau lebih paket metrik kemampuan observasi.
- Metrik bidang kontrol: Pantau kondisi komponen Kubernetes dengan mengumpulkan metrik untuk server Kubernetes API, Penjadwal, dan Pengelola Pengontrol. Metrik ini adalah sinyal kondisi layanan yang berguna untuk menentukan tujuan tingkat layanan (SLO).
- Metrik status kube: Pantau kondisi objek Kubernetes seperti Deployment, Node, dan Pod.
- Metrik cAdvisor/Kubelet: Pantau kondisi container dan kubelet.
Metrik pihak ketiga dan metrik buatan pengguna
Untuk memantau aplikasi pihak ketiga yang berjalan di cluster Anda seperti Postgres, MongoDB, dan Redis, gunakan eksportir Prometheus dengan Google Cloud Managed Service for Prometheus.
Anda juga dapat menulis eksportir kustom untuk memantau sinyal kondisi dan performa lainnya.
Menggunakan data yang dikumpulkan
Gunakan data yang Anda kumpulkan untuk menganalisis kondisi aplikasi, melakukan proses debug, memecahkan masalah, dan menguji saat Anda mengembangkan, men-deploy, dan memelihara aplikasi.
GKE menyediakan fitur kemampuan observasi bawaan untuk membantu Anda memulai dengan cepat:
Lihat data yang dikumpulkan untuk cluster dan workload Anda di GKE dasbor kemampuan observasi. Anda dapat menyesuaikan dasbor yang disediakan untuk tujuan berikut:
- Melihat metrik cluster utama, seperti pemanfaatan CPU, pemanfaatan memori, dan jumlah insiden terbuka.
- Melihat cluster berdasarkan infrastruktur, workload, atau Layanan.
- Memeriksa namespace, Node, workload, Layanan, Pod, dan container.
- Untuk Pod dan container, lihat metrik sebagai fungsi waktu dan lihat entri log.
Anda juga dapat membuat dasbor sendiri atau mengimpor dasbor Grafana untuk memenuhi kebutuhan Anda.
Lihat detail workload AI/ML Anda di Google Cloud konsol, termasuk resource seperti JobSet, RayJob, PyTorchJob, dan Deployment untuk penayangan inferensi.
Dari tab Observability, Anda dapat membuat kebijakan pemberitahuan yang direkomendasikan sehingga Anda akan diberi tahu tentang masalah. Untuk mempelajari pemberitahuan lebih lanjut, lihat Ringkasan pemberitahuan.
Buat SLO untuk memantau sasaran performa layanan Anda menggunakan metrik GKE yang dikumpulkan.
Gunakan playbook GKE untuk memecahkan masalah umum seperti Pod yang tidak dapat dijadwalkan dan container yang berulang kali mengalami error setelah dimulai ulang.
Jelajahi dan analisis data Anda dengan alat seperti Logs Explorer, Metrics Explorer dan Error Reporting.
Tinjau log audit GKE yang mencatat aktivitas administratif dan akses sebagai bagian dari Cloud Audit Logs. Kebijakan log audit menentukan peristiwa yang dicatat dan apakah entri log termasuk dalam log Aktivitas Admin atau log Akses Data.
Fitur lainnya
GKE terintegrasi dengan layanan lain Google Cloud untuk membantu Anda memantau dan mengelola cluster dan workload.
Gunakan dasbor postur keamanan untuk mengidentifikasi masalah keamanan berdasarkan standar dan praktik terbaik industri kami.
Lihat insight dan rekomendasi untuk mengoptimalkan cluster Anda.
Gunakan logging kebijakan jaringan untuk membantu Anda memecahkan masalah kebijakan jaringan Kubernetes. Jika Anda menggunakan GKE Dataplane V2, logging kebijakan jaringan akan otomatis tersedia.
Harga
Harga untuk integrasi dengan Cloud Logging (termasuk Cloud Audit Logs), Cloud Monitoring, dan Google Cloud Managed Service for Prometheus didasarkan pada jumlah log dan metrik yang dikumpulkan. Lihat halaman Harga untuk mengetahui detailnya.
Fitur yang disediakan oleh layanan lain yang tercantum di Fitur lainnya memiliki harga terpisah. Google Cloud Lihat bagian Harga di halaman dokumentasi tersebut untuk mengetahui informasi selengkapnya.
Langkah berikutnya
Amati cluster Anda. Pelajari cara melihat dasbor, mengatur informasi cluster, dan melihat detail pemberitahuan.
Aktifkan logging audit tingkat OS yang mendetail di node cluster GKE dan cara mengekspor log ke Cloud Logging.
Untuk mengetahui informasi selengkapnya tentang cara menggunakan fitur kemampuan observasi untuk memecahkan masalah GKE, lihat Melakukan analisis historis dengan Cloud Logging dan Melakukan pemantauan proaktif dengan Cloud Monitoring.