Los clústeres conectados a Distributed Cloud usan un plano de control local implementado en tu hardware conectado a Distributed Cloud. Cuando se pierde la conexión a Google Cloud, tus clústeres entran en modo de supervivencia y tus cargas de trabajo siguen ejecutándose durante un máximo de 7 días. Si una carga de trabajo deja de funcionar mientras el clúster está en modo de supervivencia, el almacenamiento en caché de imágenes local garantiza que la carga de trabajo vuelva a funcionar cuando se restablezca la conexión Google Cloud .
Un clúster puede entrar en modo de supervivencia debido a una falla de hardware o software fuera del control de Google, o bien debido a una falla en el hardware o software conectado de Distributed Cloud.
Ejemplos de fallas que están fuera del control de Google:
- Falla de conectividad a Internet en el sitio de implementación
- Configuración incorrecta del firewall o la red, o falla de hardware en el sitio de implementación.
- La instancia del proxy de límite que entrega el clúster se desconectó o está mal configurada.
Si tu clúster de Distributed Cloud conectado funciona en modo de supervivencia durante 7 días o menos debido a una falla de hardware o software que está fuera del control de Google, el Atención al cliente de Google trabajará contigo para restablecer su funcionamiento normal hasta el día 7. Después de ese plazo, no se garantiza la asistencia adicional.
Estos son algunos ejemplos de fallas en el hardware o software conectado a Distributed Cloud:
- Una actualización de software defectuosa de Distributed Cloud conectado
- Se produjo una falla en la máquina conectada de Distributed Cloud o en el hardware de redes.
- Falla sin diagnosticar en el software de Distributed Cloud conectado
Si tu clúster conectado de Distributed Cloud entra en modo de supervivencia debido a una falla en el software o hardware conectado de Distributed Cloud, el Atención al cliente de Google trabajará contigo hasta que se restablezca el funcionamiento normal del clúster.
Qué sucede cuando un clúster entra en modo de supervivencia
Cuando un clúster de Distributed Cloud conectado entra en modo de supervivencia, ocurre lo siguiente:
- Google crea automáticamente un caso de asistencia en relación con tu implementación de Distributed Cloud conectado con la información de contacto que proporcionaste cuando pediste el hardware de Distributed Cloud conectado.
- Recibirás una notificación por correo electrónico que indica que el clúster entró en modo de supervivencia y que se creó un caso de asistencia.
- El equipo de asistencia de Google trabajará contigo para restablecer el funcionamiento normal de tu clúster.
Operación del clúster en modo de supervivencia
Cuando se encuentra en modo de supervivencia, un clúster conectado a Distributed Cloud funciona de la siguiente manera:
- Cuando se pierde la conexión con Google Cloud , Distributed Cloud Connected intenta continuamente volver a conectarse a Google Cloud hasta que se restablece la conexión.
- Se inhabilitó el control sobre las cargas de trabajo a través de Google Cloud CLI, la CLI de
kubectly la API de Distributed Cloud Edge Container. Sin embargo, puedes generar credenciales sin conexión para acceder a tus clústeres a través de una conexión a Internet alternativa, como se describe en Cómo obtener credenciales para un clúster. - Las actualizaciones de software, los SLO y las reparaciones de hardware de Distributed Cloud no están disponibles.
- Los registros y las métricas limitados se sincronizan con Google Cloud después de que se restablece la conexión con Google Cloud :
- Las métricas del sistema se limitan a 6 GB o 22 horas, según el límite que se alcance primero.
- Los registros de cargas de trabajo se limitan a 4 horas.
- Las métricas de carga de trabajo se limitan a 1 GB.
- Los registros de auditoría se limitan a 10 GB.
- De forma predeterminada, si un nodo se reinicia mientras el clúster está desconectado de Google Cloud, no puede volver a unirse a su clúster hasta que se restablezca la conexión con Google Cloud, ya que no se puede actualizar su clave de autenticación. Google Cloud Tienes la opción de especificar un período de reinicio sin conexión durante el cual un nodo puede volver a unirse a un clúster después de reiniciarse mientras el clúster se ejecuta en modo de supervivencia. Para obtener más información, consulta Crea un clúster.
Qué hacer cuando un clúster sale del modo de supervivencia
Cuando un clúster conectado de Distributed Cloud sale del modo de supervivencia, verifica lo siguiente:
- Versión de software de Distributed Cloud conectado. Es posible que debas actualizar el clúster afectado a la versión más reciente del software conectado de Distributed Cloud, a menos que hayas fijado deliberadamente el clúster a una versión de software específica. Para obtener más información, consulta Actualiza la versión de software de un clúster.
- Certificados de administración de flotas Es posible que debas actualizar los certificados LOA vencidos de administración de la flota. Para solucionar este problema, comunícate con el equipo de Atención al cliente de Google.
Verifica el estado de conexión de un clúster
Para verificar el estado de tu clúster de Distributed Cloud, completa los pasos que se indican en Obtén información sobre un clúster. Google Cloud
El comando devuelve el valor del campo connectionState. Este campo puede tener uno de los siguientes valores:
CONNECTED: El clúster está conectado y completamente sincronizado con Google Cloud.DISCONNECTED: El clúster no está conectado a Google Cloud.CONNECTED_AND_SYNCING: El clúster se volvió a conectar a Google Cloud y está sincronizando los datos sin conexión con Google Cloud. No desconectes este clúster de Google Cloud hasta que se complete la sincronización.