Halaman ini menjelaskan cara melakukan debug masalah node di Google Distributed Cloud (software saja) untuk VMware menggunakan rangkaian alat debug yang telah diinstal sebelumnya.
Ringkasan
Setiap cluster Google Distributed Cloud yang Anda buat terdiri dari beberapa node. Setiap node mencakup distribusi
CoreOS' toolbox, skrip shell
yang mengekstrak dan menjalankan container debug, debug-toolbox.
debug-toolbox adalah image container yang menyertakan beberapa alat debug yang berguna
tools.
Jika mengalami masalah dengan node tertentu, Anda dapat mencoba melakukan debug dengan
menghubungkan ke node yang terpengaruh, menjalankan skrip toolbox untuk mengekstrak dan menjalankan
debug-toolbox container, serta menjalankan alat yang disertakan dalam container.
Alat yang disertakan dalam container debug-toolbox
Container debug-toolbox menjalankan image dasar Debian yang menyertakan paket berikut:
- bash
- curl
- dnsutils
- hping3
- iperf3
- lsof
- netcat
- mtr
- procps
- strace
- tcpdump
- traceroute
- util-linux
Karena alat ini disertakan dalam container, alat ini tidak memerlukan koneksi internet. Jika ingin menginstal alat debug tambahan, Anda menggunakan apt-get, yang memerlukan koneksi internet.
Menggunakan toolbox
Jalankan perintah
toolbox:sudo toolbox
Perintah ini memulai container
debug-toolbox.Saat berada di dalam container, jalankan salah satu alat. Misalnya,
tcpdump.Setelah selesai, keluar dari container dan tutup koneksi SSH ke node.
Detektor Masalah Node
Detektor Masalah Node,
yang diaktifkan untuk semua node dalam cluster, membantu mendeteksi
beberapa masalah node umum dengan cepat. Detektor Masalah Node terus memeriksa kemungkinan masalah dan melaporkannya sebagai peristiwa dan kondisi di node. Jika node berperilaku tidak normal, Anda dapat memeriksa apakah Detektor Masalah Node mendeteksi masalah tersebut dengan menjalankan kubectl describe di node dan mencari peristiwa serta kondisi yang sesuai.
Monitor Detektor Masalah Node menghasilkan beberapa kondisi di node. Jika kondisi yang dilaporkan adalah KubeletUnhealthy atau ContainerRuntimeUnhealthy, memulai ulang layanan systemd yang sesuai (kubelet atau Docker) dapat membantu membuat node kembali sehat.
Mulai Google Distributed Cloud versi 1.5, perbaikan otomatis layanan kubelet dan docker systemd diaktifkan di Detektor Masalah Node. Jika Detektor Masalah Node mendeteksi kondisi KubeletUnhealthy atau ContainerRuntimeUnhealthy di node, Detektor Masalah Node akan mencoba memulai ulang layanan kubelet atau Docker secara otomatis jika durasi sejak memulai ulang terakhir berada di atas nilai minimum tertentu.
Langkah berikutnya
Jika memerlukan bantuan tambahan, hubungi Layanan Pelanggan Cloud.
Anda juga dapat melihat Mendapatkan dukungan untuk mengetahui informasi selengkapnya tentang resource dukungan, termasuk hal berikut:
- Persyaratan untuk membuka kasus dukungan.
- Alat untuk membantu Anda memecahkan masalah, seperti log dan metrik.
- Komponen,versi, danfitur Google Distributed Cloud untuk VMware (software saja) yang didukung.