Problemas conocidos de GKE en AWS

En esta página, se enumeran los problemas conocidos seleccionados para GKE en AWS y los pasos que puedes seguir para reducir su impacto.

Para filtrar los problemas conocidos por versión o categoría del producto, selecciona los filtros en los siguientes menús desplegables.

Si formas parte del Programa para desarrolladores de Google, guarda esta página para recibir notificaciones cuando se publique una nota de la versión relacionada con ella. Para obtener más información, consulta Páginas guardadas.

Selecciona tu versión de GKE en AWS:

Selecciona la categoría de tu problema:

O bien, busca tu problema:

Categoría Versiones identificadas Problema y solución
Operaciones

1.28.0-gke.0 hasta 1.28.8-gke.800, sin incluirla

1.27.0-gke.0 hasta 1.27.12-gke.800, sin incluirla

1.26, 1.25, 1.24, 1.23 y 1.22

El escalador automático de clústeres no realiza el escalamiento vertical correctamente desde cero nodos para los grupos de nodos con etiquetas o taints personalizados.

Este problema se produce porque el escalador automático del clúster de GKE en AWS no configuró las etiquetas y los taints del grupo de nodos en el grupo de ajuste de escala automático correspondiente durante el aprovisionamiento del grupo de nodos. En el caso de los grupos de nodos con cero nodos, el escalador automático del clúster no puede crear las plantillas de nodos correctamente debido a la falta de estas etiquetas. Esto podría generar decisiones de escalamiento incorrectas, como que los Pods no se programen para los nodos aplicables o que se aprovisionen nodos que no son realmente necesarios.

Para obtener más información, consulta Configuración del descubrimiento automático.

Redes

1.26.0-gke.0 hasta 1.26.4-gke.220, sin incluirla

Desde la versión 1.25.0-gke.0 hasta la 1.25.10-gke.1200, sin incluirla

1.24 a partir de 1.24.0-gke.0

1.23 a partir de la versión 1.23.8-gke.1700

Los clústeres que se ejecutan en un SO Ubuntu que usa el kernel 5.15 o una versión posterior son susceptibles a fallas en la inserción de la tabla de seguimiento de conexiones (conntrack) de netfilter. Las fallas de inserción pueden ocurrir incluso cuando la tabla de seguimiento de conexiones tiene espacio para entradas nuevas. Los errores se deben a cambios en el kernel 5.15 y versiones posteriores que restringen las inserciones de tablas según la longitud de la cadena.

Para ver si este problema te afecta, verifica las estadísticas del sistema de seguimiento de conexiones en el kernel con el siguiente comando:

    sudo conntrack -S
    

La respuesta es similar a la que se muestra a continuación:

cpu=0       found=0 invalid=4 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=1       found=0 invalid=0 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=2       found=0 invalid=16 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=3       found=0 invalid=13 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=4       found=0 invalid=9 insert=0 insert_failed=0 drop=0 early_drop=0
error=0 search_restart=0 clash_resolve=0 chaintoolong=0
cpu=5       found=0 invalid=1 insert=0 insert_failed=0 drop=0 early_drop=0
error=519 search_restart=0 clash_resolve=126 chaintoolong=0
    

Si un valor de chaintoolong en la respuesta es un número distinto de cero, te afecta este problema.

Solución alternativa:

Si ejecutas la versión 1.26.2-gke.1001, actualiza a la versión 1.26.4-gke.2200 o una posterior.

Usabilidad 1.25.5-gke.1500 y 1.25.4-gke.1300

Algunas superficies de la IU en la consola de Google Cloud no pueden autorizar el acceso al clúster y es posible que lo muestren como inaccesible.

Solución alternativa:

Actualiza tu clúster al parche más reciente disponible de la versión 1.25. Este problema se solucionó en la versión 1.25.5-gke.2000.

Usabilidad 1.22

Kubernetes 1.22 da de baja y reemplaza varias API. Si actualizaste tu clúster a la versión 1.22 o posterior, cualquier llamada que tu aplicación realice a una de las API obsoletas fallará.

Solución alternativa:

Actualiza tu aplicación para reemplazar las llamadas a la API obsoletas por sus equivalentes más recientes.

Si necesitas asistencia adicional, comunícate con Atención al cliente de Cloud.