Memecahkan masalah cluster yang terdaftar di GKE On-Prem API

Halaman ini menunjukkan cara menyelidiki masalah saat membuat cluster pengguna Google Distributed Cloud di Google Cloud konsol.

GKE On-Prem API adalah API yang dihosting Google Cloud yang memungkinkan Anda mengelola siklus proses cluster lokal menggunakan Terraform dan alat standar Google Cloud GKE On-Prem API berjalan di Google Cloud's infrastruktur Google Cloud. Terraform, the Google Cloud console, dan Google Cloud CLI adalah klien API, dan menggunakan API untuk membuat, mengupdate, mengupgrade, dan menghapus cluster di pusat data Anda. Jika Anda membuat cluster menggunakan klien standar, cluster akan terdaftar di GKE On-Prem API, yang berarti Anda dapat menggunakan klien standar untuk mengelola siklus proses cluster (dengan beberapa pengecualian).

Cluster admin tidak ditampilkan di daftar drop-down Cluster basics

Cluster admin harus didaftarkan ke fleet sebelum Anda dapat membuat cluster pengguna di konsol Google Cloud . Jika Anda tidak melihat cluster admin di daftar drop-down di bagian Cluster basics di Google Cloud konsol, cluster admin tidak terdaftar, atau terdaftar menggunakan gcloud container fleet memberships register perintah. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Periksa status pendaftaran:

  • Di Google Cloud konsol, buka halaman Kubernetes Engine > Clusters, lalu pilih project yang sama dengan yang Anda gunakan saat mencoba membuat cluster pengguna Google Cloud .

    Buka halaman cluster GKE

    • Jika cluster admin tidak ditampilkan dalam daftar, lihat Mendaftarkan cluster admin.

    • Jika cluster admin ditampilkan dalam daftar, perilaku ini menunjukkan bahwa cluster terdaftar menggunakan perintah gcloud container hub memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Untuk memperbaiki masalah pendaftaran, selesaikan langkah-langkah berikut:

  1. Hapus keanggotaan fleet cluster admin.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: nama cluster admin.
    • PROJECT_ID: ID project host fleet Anda . Ini adalah project yang Anda pilih saat mencoba membuat cluster pengguna di Google Cloud konsol.
  2. Ikuti langkah-langkah di Mendaftarkan cluster admin untuk mendaftarkan ulang cluster.

Error pembuatan cluster

Bagian ini menjelaskan beberapa error yang terjadi selama pembuatan cluster di Google Cloud konsol.

Error resource sudah ada

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan berikut ini:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Pesan error ini menunjukkan bahwa nama cluster sudah digunakan.

Salah satu solusi untuk memperbaiki masalah ini adalah menghapus dan membuat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan nama lain yang tidak bertentangan dengan cluster yang ada.

Error grup anti-afinitas

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan berikut ini:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Aturan anti-afinitas VMware Distributed Resource Scheduler (DRS) memerlukan minimal 3 host fisik di lingkungan vSphere Anda. Untuk memperbaiki masalah ini, nonaktifkan Anti-affinity groups di bagian Features pada halaman Cluster details untuk cluster Anda, sebagai berikut:

  1. Di Google Cloud konsol, buka halaman cluster GKE.

    Buka halaman cluster GKE

  2. Pilih project tempat cluster pengguna berada. Google Cloud

  3. Di daftar cluster, klik nama cluster, lalu klik View details di panel Details.

  4. Di bagian Features, klik Edit.

  5. Hapus centang Enable Anti-affinity groups, lalu klik Done.

  6. Konsol menampilkan Cluster status: changes in progress. Google Cloud Klik Show Details untuk melihat Resource status condition dan Status messages.

Error alamat IP yang bertentangan

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan berikut ini:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Anda tidak dapat mengedit kolom seperti Control plane VIP dan Ingress VIP di bagian Load balancer pada halaman Cluster details di Google Cloud konsol. Untuk memperbaiki alamat IP yang bertentangan, hapus dan buat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan alamat IP yang tidak bertentangan dengan cluster yang ada.

Menghapus cluster yang tidak responsif

Cluster dapat berada dalam status tidak responsif karena berbagai alasan, seperti:

  • Masalah konektivitas dengan Connect Agent atau lingkungan lokal.
  • Cluster admin untuk cluster pengguna dihapus, atau ada masalah konektivitas antara cluster admin dan cluster pengguna.
  • VM cluster dihapus sebelum menghapus cluster.

Jika konsol tidak dapat menghapus cluster, gunakan perintah gcloud CLI untuk menghapus Google Cloud resource dari cluster yang tidak responsif. Jika Anda belum mengupdate gcloud CLI baru-baru ini, jalankan perintah berikut untuk mengupdate komponen:

gcloud components update

Selanjutnya, hapus Google Cloud resource.

Cluster pengguna

  1. Hapus cluster pengguna:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Ganti kode berikut:

    • USER_CLUSTER_NAME: Nama cluster pengguna yang akan dihapus.

    • PROJECT_ID: ID project tempat cluster terdaftar.

    • REGION: Lokasi yang terkait dengan cluster pengguna. Google Cloud Lokasi ditampilkan di konsol.

      Flag --force menghapus cluster yang memiliki node pool. Tanpa flag --force, Anda harus menghapus node pool terlebih dahulu, lalu menghapus cluster.

      Flag --allow-missing memungkinkan perintah untuk dilanjutkan jika cluster tidak ditemukan.

      Flag --ignore-errors menghapus Google Cloud resource saat cluster admin dan pengguna tidak dapat dijangkau. Beberapa resource F5 atau vSphere mungkin tertinggal. Lihat Membersihkan resource untuk mengetahui informasi tentang cara membersihkan resource yang tertinggal.

      Perintah ini menghapus cluster jika ada dan menghapus resource keanggotaan fleet dan GKE On-Prem API dari Google Cloud.

  2. Konfirmasi bahwa resource GKE On-Prem API telah dihapus:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Jika Anda menetapkan --location=-, artinya mencantumkan semua cluster di semua region. Jika Anda perlu mempersempit daftar, tetapkan --location ke a region tertentu.

  3. Konfirmasi bahwa resource keanggotaan fleet telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster admin

  1. Jika Anda mendaftarkan cluster admin di GKE On-Prem API, batalkan pendaftarannya:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing 
    

    Ganti kode berikut:

    • ADMIN_CLUSTER_NAME: Nama cluster admin.
    • PROJECT_ID: ID project host fleet.
    • REGION: Region. Google Cloud

    Flag --allow-missing membatalkan pendaftaran cluster jika keanggotaan fleet tidak ditemukan.

    Perintah ini menghapus resource GKE On-Prem API dari Google Cloud.

  2. Hapus cluster dari fleet:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Perintah ini menghapus resource keanggotaan fleet dari Google Cloud.

  3. Konfirmasi bahwa resource GKE On-Prem API telah dihapus:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Jika Anda menetapkan --location=-, artinya mencantumkan semua cluster di semua region. Jika Anda perlu mempersempit daftar, tetapkan --location ke a region tertentu.

  4. Konfirmasi bahwa resource keanggotaan fleet telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Langkah berikutnya

Jika Anda memerlukan bantuan tambahan, hubungi Layanan Pelanggan Cloud.

Anda juga dapat melihat Mendapatkan dukungan untuk mengetahui informasi selengkapnya tentang resource dukungan, termasuk hal berikut:

  • Persyaratan untuk membuka kasus dukungan.
  • Alat untuk membantu Anda memecahkan masalah, seperti log dan metrik.
  • Komponen,versi, danfitur Google Distributed Cloud untuk VMware (software saja) yang didukung.