En esta página, se describen las prácticas recomendadas para garantizar la alta disponibilidad de tu instalación de Google Distributed Cloud conectado. Distributed Cloud conectado no ofrece un Acuerdo de Nivel de Servicio (ANS) y solo proporciona el objetivo de nivel de servicio (SLO) que se describe en esta página.
Elige y aplica el nivel de disponibilidad
Debes elegir el nivel de disponibilidad para tus cargas de trabajo de Distributed Cloud conectado que mejor se adapte a los requisitos de tu empresa. Por ejemplo, una aplicación de autopago en una tienda minorista tiene un riesgo de disponibilidad mucho menor que una implementación de RAN perimetral de un operador de red móvil.
La disponibilidad de destino es directamente proporcional a la capacidad de recursos de repuesto de Distributed Cloud que reservas para emergencias. En la siguiente tabla, se describe esta relación. Estas estimaciones no incluyen el tiempo de inactividad programado con un período de mantenimiento.
El software de Distributed Cloud conectado consume algunos recursos en cada máquina física. La cantidad varía según la configuración específica de tu implementación de Distributed Cloud conectado. Google recomienda que realices pruebas comparativas de tu implementación de Distributed Cloud conectado para medir esta cantidad y tenerla en cuenta cuando planifiques la distribución de tu carga de trabajo.
| Capacidad en uso | Capacidad reservada | Disponibilidad de destino |
|---|---|---|
| 66.6% | 33.3% | 99.9% |
Es posible que experimentes una pérdida repentina de capacidad debido a una falla de hardware o a un nodo que requiere un reinicio. Para prepararte para esto, debes diseñar tus cargas de trabajo teniendo en cuenta las cuotas de recursos para que siempre tengas capacidad disponible en cada nodo de Distributed Cloud conectado que cumpla con el nivel de disponibilidad elegido.
Diversifica geográficamente tus zonas de Distributed Cloud
Para minimizar el impacto de posibles fallas del plano de administración, te recomendamos que distribuyas tus zonas de Distributed Cloud en varias regiones vecinas.
Usa el modo de capacidad de supervivencia
Los clústeres de Distributed Cloud usan un plano de control local que se ejecuta en tu hardware de Distributed Cloud conectado. Tus cargas de trabajo continúan ejecutándose cuando se pierde la conexión a Google Cloud . Para obtener más información, consulta el modo de capacidad de supervivencia de Distributed Cloud conectado.
Información sobre las actualizaciones de software y los períodos de mantenimiento
Google actualiza periódicamente el software de Distributed Cloud conectado. Estas actualizaciones de software son obligatorias y no puedes inhabilitarlas. Distributed Cloud conectado te permite especificar períodos de mantenimiento individuales para cada uno de tus clústeres de Distributed Cloud conectado.
Para mitigar posibles interrupciones transitorias en tus cargas de trabajo, los períodos de mantenimiento te permiten controlar cuándo pueden ocurrir las actualizaciones automáticas de los planos de control y los nodos. Los períodos de mantenimiento son útiles en distintos tipos de situaciones, por ejemplo:
- Horas de menor demanda: para disminuir las posibilidades de que ocurran tiempos de inactividad, programa actualizaciones automáticas durante las horas de menor demanda, que es cuando el tráfico es reducido.
- De guardia: asegúrate de que las actualizaciones se realizan durante el horario laboral para que alguien pueda supervisar y administrar cualquier problema inesperado.
- Actualizaciones de varios clústeres: implementa actualizaciones en varios clústeres en diferentes regiones, una por una y en intervalos específicos.
Distributed Cloud conectado admite los siguientes tipos de períodos de mantenimiento:
- Período de mantenimiento. Especifica un período durante el cual Google puede realizar mantenimiento y actualizaciones de software en tu clúster de Distributed Cloud conectado.
- Período de exclusión de mantenimiento. Especifica un período durante el cual Google no puede realizar mantenimiento ni actualizaciones de software en tu clúster de Distributed Cloud conectado. Para configurar un período de exclusión de mantenimiento, primero debes configurar un período de mantenimiento. Un período de exclusión de mantenimiento tiene prioridad sobre el período de mantenimiento del clúster.
Además de las actualizaciones automáticas, es posible que Google necesite realizar otras tareas de mantenimiento. En esos casos, respeta el período de mantenimiento de un clúster cuando sea posible.
Si una actualización de software o una tarea de mantenimiento no finaliza antes del final de un período de mantenimiento, Distributed Cloud conectado pausa la actualización o la tarea y la reanuda durante el siguiente período de mantenimiento programado. Si falla una actualización de software, Distributed Cloud conectado detiene la actualización. En esos casos, debes comunicarte con el equipo de asistencia de Google para reparar la instalación del software.
Distributed Cloud conectado se reserva el derecho de implementar actualizaciones de emergencia sin planificar fuera del período de mantenimiento. Además, las actualizaciones obligatorias de software obsoleto o desactualizado pueden ocurrir de manera automática fuera de los períodos de mantenimiento.
También puedes actualizar tu clúster de forma manual en cualquier momento. Las actualizaciones iniciadas de forma manual ignoran cualquier período de mantenimiento y comienzan de inmediato.
Si deseas obtener información para configurar un período de mantenimiento en un clúster nuevo o existente, consulta Configura un período de mantenimiento.
Escalonamiento de actualizaciones de software
Para reducir el tiempo de inactividad de la carga de trabajo, las actualizaciones de software de Distributed Cloud conectado se escalonan. En otras palabras, Google actualiza los nodos trabajador en cada clúster de Distributed Cloud conectado en etapas. Todos los nodos trabajador de una etapa de actualización de software se interrumpen de forma simultánea.
También tienes la opción de establecer tu propio tamaño de etapa de actualización de software. En otras palabras, puedes especificar la cantidad de nodos que se pueden interrumpir para una actualización de software de forma simultánea en un clúster de Distributed Cloud conectado. Para obtener instrucciones, consulta Administra el tiempo de inactividad de los nodos durante las actualizaciones de software.
Restricciones
Los períodos de mantenimiento tienen las siguientes restricciones:
Un período de mantenimiento por clúster. Solo puedes configurar un único período de mantenimiento por clúster. Si configuras un período de mantenimiento nuevo, se reemplaza el anterior.
Zonas horarias para períodos de mantenimiento. Cuando configuras y visualizas los períodos de mantenimiento, los horarios se muestran de manera diferente según la herramienta que uses, como se detalla en las siguientes secciones.
Cuando configuras períodos de mantenimiento
Cuando usas la marca más genérica --maintenance-window para configurar un período de mantenimiento, no puedes especificar una zona horaria. Cuando usas Google Cloud CLI o la API, se usa UTC para mostrar los horarios. La
Google Cloud consola usa la zona horaria local para mostrar los horarios.
Cuando usas marcas más detalladas, como --maintenance-window-start, puedes especificar la zona horaria como parte del valor. Si omites la zona horaria, se usa tu zona horaria local. Los horarios siempre se almacenan en UTC.
Cuando visualizas períodos de mantenimiento
Cuando visualizas información sobre tu clúster, puede que las marcas de tiempo de los períodos de mantenimiento se muestren en UTC o en tu zona horaria local, según la manera en la que veas la información:
- Cuando usas la Google Cloud consola para ver información sobre tu clúster, los horarios siempre se muestran en tu zona horaria local.
- Si usas gcloud CLI para ver información sobre tu clúster, los horarios siempre se muestran en UTC.
En ambos casos, RRULE siempre está en UTC. Eso significa que si, por ejemplo, especificas días de la semana, esos días están en UTC.
Configura períodos de mantenimiento del clúster
Distributed Cloud conectado te permite especificar un período de mantenimiento para cada uno de tus clústeres de Distributed Cloud conectado. Este período le indica a Google que solo actualice el software de Distributed Cloud durante el tiempo y con la frecuencia que especifiques.
Las siguientes reglas rigen los períodos de mantenimiento del clúster de Distributed Cloud conectado:
- Si especificas un período de mantenimiento para un clúster de Distributed Cloud conectado, Google actualiza tu software de Distributed Cloud conectado 48 horas después de que se haya anunciado la actualización a través de las notas de la versión de Distributed Cloud conectado. En la página de notas de la versión, puedes suscribirte al feed RSS de las notas de la versión de Distributed Cloud conectado para mantenerte informado sobre las actualizaciones de software a medida que se lanzan.
- La duración mínima de un período de mantenimiento es de cinco horas. Puedes especificar un período más largo según la complejidad de tu instalación de Distributed Cloud conectado y los requisitos de tu empresa.
- La frecuencia mínima de las actualizaciones de software es de una vez por semana. Puedes especificar períodos de mantenimiento semanales o diarios. Puedes incluir y excluir días específicos.
- Puedes cambiar el programa de períodos de mantenimiento de un clúster en cualquier momento, excepto cuando ya se programó un período de mantenimiento o cuando está en curso.
- Si la actualización de software no se completa dentro del período especificado, se pausa y, luego, se reanuda durante el siguiente período de mantenimiento programado.
Para obtener instrucciones detalladas, consulta Configura un período de mantenimiento para un clúster.
Reparación de hardware con fallas
Cuando Google detecta una falla del hardware de Distributed Cloud conectado, hacemos una de las siguientes acciones:
En el caso del hardware de Distributed Cloud propiedad de Google, Google intenta programar una visita al sitio en un plazo de tres días hábiles. Para que un técnico autorizado por Google realice el diagnóstico y las reparaciones necesarias, debes otorgarle acceso al hardware de Distributed Cloud conectado.
En el caso del hardware de Distributed Cloud propiedad del cliente, Google te notifica a ti y al SI certificado por Google sobre el problema. Debes trabajar con el SI que entregó tu hardware de Distributed Cloud conectado para programar una visita del técnico y realizar el diagnóstico y las reparaciones necesarias.
Si se produce una falla en el hardware de Distributed Cloud conectado, Google o un SI certificado por Google reemplazan toda la máquina. Antes de que se quite la máquina de tus instalaciones, Google se asegura de que tus datos se hayan borrado de forma segura de todas sus unidades.
Otros puntos de falla
Eres responsable de mantener los siguientes aspectos de tu instalación de Distributed Cloud que están fuera del control de Google y que pueden afectar la disponibilidad de Distributed Cloud conectado:
- Todos los datos que elijas almacenar en el hardware de Distributed Cloud conectado. Esto incluye copias de seguridad redundantes y funcionales, y la exportación de tus datos antes de devolver el hardware de Distributed Cloud conectado a Google.
- Fuente de alimentación eléctrica.
- Temperatura ambiente, humedad y enfriamiento.
- Seguridad física del hardware.
- Seguridad de la red local.
- Conectividad a Internet y de red local. Distributed Cloud conectado debe volver a conectarse a Google Cloud cada 7 días para actualizar los tokens de seguridad, las claves de encriptación, y sincronizar los datos de registro y administración.