Soluciona problemas relacionados con los clústeres inscritos en la API de GKE On-Prem

En esta página, se muestra cómo investigar problemas para crear un clúster de usuario de Google Distributed Cloud en la Google Cloud consola.

La API de GKE On-Prem es una API alojada en Google Cloud que te permite administrar el ciclo de vida de tus clústeres locales con Terraform y herramientas estándares Google Cloud La API de GKE On-Prem se ejecuta en Google Cloud's la infraestructura de. Terraform, la Google Cloud consola y la Google Cloud CLI son clientes de la API y la usan para crear, actualizar, actualizar a una versión superior y eliminar clústeres en tu centro de datos. Si creaste el clúster con un cliente estándar, el clúster está inscrito en la API de GKE On-Prem, lo que significa que puedes usar los clientes estándar para administrar el ciclo de vida del clúster (con algunas excepciones).

El clúster de administrador no se muestra en la lista desplegable Aspectos básicos del clúster

El clúster de administrador debe estar registrado en una flota antes de que puedas crear clústeres de usuario en la Google Cloud consola. Si no ves el clúster de administrador en la lista desplegable en la sección Conceptos básicos del clú1ster en la Google Cloud consola, significa que el clúster de administrador no estaba registrado o que se registró con el gcloud container fleet memberships register comando. Este comando gcloud no registra de forma correcta los clústeres de administrador.

Comprueba el estado del registro:

  • En la Google Cloud consola, ve a la página Kubernetes Engine > Clústeres y selecciona el mismo Google Cloud proyecto en el que intentaste crear el clúster de usuario.

    Ir a la página de clústeres de GKE

    • Si el clúster de administrador no se muestra en la lista, consulta Registra un clúster de administrador.

    • Si el clúster de administrador se muestra en la lista, indica que el clúster se registró con el comando gcloud container hub memberships register. Este comando gcloud no registra de forma correcta los clústeres de administrador.

Para solucionar el problema de registro, completa los siguientes pasos:

  1. Borra la membresía de la flota del clúster de administrador.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: Es el nombre del clúster de administrador.
    • PROJECT_ID: Es el ID del proyecto host de tu flota. Este es el proyecto que seleccionaste cuando intentaste crear el clúster de usuario en la Google Cloud consola.
  2. Sigue los pasos en Registra un clúster de administrador para volver a registrarlo.

Errores de creación de clústeres

En esta sección, se describen algunos errores que ocurren durante la creación del clúster en la Google Cloud consola.

Error de recurso existente

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Este mensaje de error indica que el nombre del clúster ya está en uso.

Una solución para solucionar este problema es borrar y volver a crear el clúster:

  1. Borra el clúster.
  2. Vuelve a crear el clúster con otro nombre que no entre en conflicto con un clúster existente.

Error de los grupos antiafinidad

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Las reglas de antiafinidad de VMware Distributed Resource Scheduler (DRS) requieren al menos 3 hosts físicos en el entorno de vSphere. Para solucionar el problema, inhabilita Grupos de antiafinidad en la sección Funciones de la página Detalles del clúster de tu clúster de la siguiente manera:

  1. En la Google Cloud consola, ve a la página Clústeres de GKE.

    Ir a la página de clústeres de GKE

  2. Selecciona el Google Cloud proyecto en el que se encuentra el clúster de usuario.

  3. En la lista de clústeres, haz clic en el nombre del clúster y, luego, en Ver detalles en el panel Detalles.

  4. En la sección Características, haz clic en Editar.

  5. Desmarca Habilitar grupos antiafinidad y haz clic en Listo.

  6. Laconsola muestra Estado del clúster: cambios en progreso. Google Cloud Haz clic en Mostrar detalles para ver la condición de estado del recurso y los mensajes de estado.

Error de direcciones IP en conflicto

La creación de un clúster de usuario falla con un mensaje de error similar al siguiente:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

No puedes editar campos como la VIP del plano de control y la VIP de Ingress en la sección Balanceador de cargas de la página Detalles del clúster en la Google Cloud consola. Para corregir las direcciones IP en conflicto, borra y vuelve a crear el clúster:

  1. Borra el clúster.
  2. Vuelve a crear el clúster con direcciones IP que no entren en conflicto con un clúster existente.

Quita los clústeres en mal estado

Un clúster puede estar en mal estado por muchos motivos, como los siguientes:

  • Problemas de conectividad con el agente de Connect o el entorno local
  • Se borró el clúster de administrador de un clúster de usuario o hay problemas de conectividad entre los clústeres de administrador y de usuario.
  • Se borró la VM del clúster antes de borrar el clúster.

Si la consola no puede borrar un clúster, usa los comandos de la gcloud CLI para borrar Google Cloud recursos de clústeres en mal estado. Si no actualizaste gcloud CLI recientemente, ejecuta el siguiente comando para actualizar los componentes:

gcloud components update

A continuación, borra los Google Cloud recursos.

Clúster de usuario

  1. Borra el clúster de usuario:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Reemplaza lo siguiente:

    • USER_CLUSTER_NAME: Es el nombre del clúster de usuario que se borrará.

    • PROJECT_ID: Es el ID del proyecto en el que está registrado el clúster.

    • REGION: Es la Google Cloud localización asociada a l clúster de usuario. La ubicación se muestra en la consola.

      La marca --force borra un clúster que tiene grupos de nodos. Sin la marca --force, primero debes borrar los grupos de nodos y, luego, el clúster.

      La marca --allow-missing permite que el comando continúe si no se encuentra el clúster.

      La marca --ignore-errors quita Google Cloud recursos cuando no se puede acceder a los clústeres de administrador y de usuario. Es posible que queden algunos recursos de F5 o vSphere. Consulta Limpia los recursos para obtener información sobre cómo limpiar los recursos restantes.

      Este comando borra el clúster si existe y quita los recursos de la API de GKE On-Prem y de la membresía de la flota de Google Cloud.

  2. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Cuando configuras --location=-, significa que se deben enumerar todos los clústeres en todas las regiones. Si necesitas reducir el alcance de la lista, configura --location en una región específica.

  3. Confirma que se hayan borrado los recursos de la membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Clúster de administrador

  1. Si inscribiste el clúster de administrador en la API de GKE On-Prem, da de baja la inscripción:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing 
    

    Reemplaza lo siguiente:

    • ADMIN_CLUSTER_NAME: Es el nombre del clúster de administrador.
    • PROJECT_ID: Es el ID del proyecto host de la flota.
    • REGION: La Google Cloud región.

    La marca --allow-missing da de baja la inscripción del clúster si no se encuentra la membresía de la flota.

    Este comando quita los recursos de la API de GKE On-Prem de Google Cloud.

  2. Quita el clúster de la flota:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Este comando quita los recursos de la membresía de la flota de Google Cloud.

  3. Confirma que se hayan borrado los recursos de la API de GKE On-Prem:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Cuando configuras --location=-, significa que se deben enumerar todos los clústeres en todas las regiones. Si necesitas reducir el alcance de la lista, configura --location en una región específica.

  4. Confirma que se hayan borrado los recursos de la membresía de la flota:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

¿Qué sigue?

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.

También puedes consultar Obtén asistencia para obtener más información sobre los recursos de asistencia, incluidos los siguientes: