Masalah umum untuk GKE on Azure

Halaman ini mencantumkan masalah umum tertentu untuk GKE on Azure, dan langkah-langkah yang dapat Anda lakukan untuk mengurangi dampaknya.

Untuk memfilter masalah umum berdasarkan versi atau kategori produk, pilih filter Anda dari menu drop-down berikut.

Jika Anda adalah bagian dari Program Developer Google, simpan halaman ini untuk menerima notifikasi saat catatan rilis terkait halaman ini dipublikasikan. Untuk mempelajari lebih lanjut, lihat Halaman Tersimpan.

Pilih versi GKE on Azure Anda:

Pilih kategori masalah Anda:

Atau, telusuri masalah Anda:

Kategori Versi yang diidentifikasi Masalah dan solusinya
Operasi 1.28, 1.27, 1.26, 1.25, 1.24, 1.23, 1.22

Autoscaler cluster tidak meningkatkan skala dari nol node dengan benar untuk node pool dengan label atau taint kustom.

Masalah ini terjadi karena autoscaler cluster GKE on Azure tidak mengonfigurasi label node pool dan tag taint pada Auto Scaling Group node pool yang sesuai selama penyediaan node pool. Untuk node pool dengan nol node, autoscaler cluster tidak dapat membuat template node dengan benar karena tag ini tidak ada. Hal ini dapat menyebabkan keputusan penskalaan yang salah, seperti Pod yang tidak dijadwalkan ke node yang berlaku, atau node yang disediakan yang sebenarnya tidak diperlukan.

Untuk mengetahui informasi selengkapnya, lihat Penyiapan Penemuan Otomatis

Jaringan

1.26.0-gke.0 hingga, tetapi tidak termasuk, 1.26.4-gke.220,

1.25.0-gke.0 hingga, tetapi tidak termasuk, 1.25.10-gke.1200,

1.24 mulai dari 1.24.0-gke.0,

1.23 mulai dari 1.23.8-gke.1700

Cluster yang berjalan di OS Ubuntu yang menggunakan kernel 5.15 atau yang lebih tinggi rentan terhadap kegagalan penyisipan tabel pelacakan koneksi netfilter (conntrack). Kegagalan penyisipan dapat terjadi meskipun tabel conntrack memiliki ruang untuk entri baru. Kegagalan ini disebabkan oleh perubahan pada kernel 5.15 dan yang lebih tinggi yang membatasi penyisipan tabel berdasarkan panjang rantai.

Untuk melihat apakah Anda terpengaruh oleh masalah ini, periksa statistik sistem pelacakan koneksi dalam kernel dengan perintah berikut:

    sudo conntrack -S
    

Responsnya terlihat seperti ini:

cpu=0       found=0 invalid=4 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=1       found=0 invalid=0 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=2       found=0 invalid=16 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=3       found=0 invalid=13 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=4       found=0 invalid=9 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=5       found=0 invalid=1 insert=0 insert_failed=0 drop=0 early_drop=0
error=519 search_restart=0 clash_resolve=126 chaintoolong=0
    

Jika nilai chaintoolong dalam respons adalah angka bukan nol, Anda terpengaruh oleh masalah ini.

Solusi:

Jika Anda menjalankan versi 1.26.2-gke.1001, upgrade ke versi 1.26.4-gke.2200 atau yang lebih baru.

Kegunaan 1.25.5-gke.1500, 1.25.4-gke.1300

Beberapa platform UI di Google Cloud konsol tidak dapat mengotorisasi ke cluster dan mungkin menampilkan cluster sebagai tidak dapat dijangkau.

Solusi:

Upgrade cluster Anda ke patch versi 1.25 terbaru yang tersedia. Masalah ini telah diperbaiki di versi 1.25.5-gke.2000.

Kegunaan 1.22

Kubernetes 1.22 menghentikan penggunaan dan mengganti beberapa API. Jika Anda telah mengupgrade cluster ke versi 1.22 atau yang lebih baru, panggilan apa pun yang dilakukan aplikasi Anda ke salah satu API yang tidak digunakan lagi akan gagal.

Solusi:

Upgrade aplikasi Anda untuk mengganti panggilan API yang tidak digunakan lagi dengan API yang lebih baru.

Jika Anda memerlukan bantuan tambahan, hubungi Layanan Pelanggan Cloud.