En esta página, se describen las prácticas recomendadas para garantizar la alta disponibilidad de tu instalación conectada de Google Distributed Cloud. Distributed Cloud Connected no ofrece un Acuerdo de Nivel de Servicio (ANS) y solo proporciona el objetivo de nivel de servicio (SLO) que se describe en esta página.
Elige e implementa el nivel de disponibilidad
Debes elegir el nivel de disponibilidad para tus cargas de trabajo conectadas a Distributed Cloud que mejor se adapte a los requisitos de tu empresa. Por ejemplo, una aplicación de autopago en una tienda minorista tiene un riesgo de disponibilidad mucho menor que una implementación de RAN perimetral de un operador de red móvil.
La disponibilidad del destino es directamente proporcional a la capacidad de recursos de reserva de Distributed Cloud que reservas para emergencias. En la siguiente tabla, se describe esta relación. Estas estimaciones no incluyen el tiempo de inactividad programado con un período de mantenimiento.
El software de Distributed Cloud conectado consume algunos recursos en cada máquina física. El importe varía según la configuración específica de tu implementación conectada de Distributed Cloud. Google recomienda que realices pruebas comparativas de tu implementación de Distributed Cloud Connected para medir esta cantidad y tenerla en cuenta cuando planifiques la distribución de tu carga de trabajo.
| Factor de forma de GDC conectado | Capacidad en uso | Capacidad reservada | Disponibilidad de objetivos |
|---|---|---|---|
| Rack de GDC conectado (clúster único de 6 máquinas) |
83.33% | 16.67% | 99.9% |
| Rack de GDC conectado (clúster único de 6 máquinas) |
100% | 0% | 93.5% |
| Servidor conectado a GDC (clúster único de 3 máquinas) |
66.6% | 33.3% | 99.9% |
Es posible que experimentes una pérdida repentina de capacidad debido a una falla de hardware o a un nodo que requiere un reinicio. Para prepararte, debes diseñar tus cargas de trabajo teniendo en cuenta las cuotas de recursos, de modo que siempre tengas capacidad disponible en cada nodo conectado de Distributed Cloud que cumpla con el nivel de disponibilidad que elegiste.
Por ejemplo, para lograr una disponibilidad objetivo del 99.9% en una implementación de rack conectado a Distributed Cloud, debes configurar tus cargas de trabajo de modo que una de las seis máquinas físicas de cada clúster conectado a Distributed Cloud esté disponible como copia de seguridad.
Diversifica geográficamente tus zonas de Distributed Cloud
Para minimizar el impacto de posibles fallas en el plano de administración, te recomendamos que distribuyas tus zonas de Distributed Cloud en varias regiones vecinas.
Cómo usar el modo de supervivencia
Los clústeres de Distributed Cloud usan un plano de control local que se ejecuta en el hardware conectado de Distributed Cloud. Tus cargas de trabajo continúan ejecutándose cuando se pierde la conexión con Google Cloud . Para obtener más información, consulta Modo de supervivencia de Distributed Cloud conectado.
Información sobre las actualizaciones de software y los períodos de mantenimiento
Google actualiza periódicamente el software de Distributed Cloud conectado. Estas actualizaciones de software son obligatorias y no puedes inhabilitarlas. Distributed Cloud Connected te permite especificar ventanas de mantenimiento individuales para cada uno de tus clústeres conectados a Distributed Cloud.
Para mitigar posibles interrupciones transitorias en tus cargas de trabajo, los períodos de mantenimiento te permiten controlar cuándo pueden ocurrir las actualizaciones automáticas de los planos de control y los nodos. Los períodos de mantenimiento son útiles en distintos tipos de situaciones, por ejemplo:
- Horas de menor demanda: para disminuir las posibilidades de que ocurran tiempos de inactividad, programa actualizaciones automáticas durante las horas de menor demanda, que es cuando el tráfico es reducido.
- De guardia: asegúrate de que las actualizaciones se realizan durante el horario laboral para que alguien pueda supervisar y administrar cualquier problema inesperado.
- Actualizaciones de varios clústeres: implementa actualizaciones en varios clústeres en diferentes regiones, una por una y en intervalos específicos.
Distributed Cloud Connected admite los siguientes tipos de períodos de mantenimiento:
- Período de mantenimiento. Especifica un período durante el cual Google puede realizar tareas de mantenimiento y actualizaciones de software en tu clúster conectado de Distributed Cloud.
- Período de exclusión de mantenimiento. Especifica un período durante el cual Google no puede realizar tareas de mantenimiento ni actualizaciones de software en tu clúster de Distributed Cloud conectado. Para configurar un período de exclusión de mantenimiento, primero debes configurar un período de mantenimiento. Un período de exclusión de mantenimiento tiene prioridad sobre el período de mantenimiento del clúster.
Además de las actualizaciones automáticas, es posible que Google necesite realizar otras tareas de mantenimiento. En esos casos, respeta el período de mantenimiento de un clúster cuando es posible.
Si la ejecución de las tareas excede el período de mantenimiento, Distributed Cloud Connected intenta pausarlas. Luego, intenta reanudar esas tareas durante el siguiente período de mantenimiento.
Distributed Cloud Connected se reserva el derecho de lanzar actualizaciones de emergencia sin planificar fuera de los períodos de mantenimiento. Además, las actualizaciones obligatorias de software obsoleto o desactualizado pueden ocurrir de manera automática fuera de los períodos de mantenimiento.
También puedes actualizar tu clúster de forma manual en cualquier momento. Las actualizaciones iniciadas de forma manual ignoran cualquier período de mantenimiento y comienzan de inmediato.
Si deseas obtener información para configurar un período de mantenimiento en un clúster nuevo o existente, consulta Configura un período de mantenimiento.
Escalonamiento de actualizaciones de software
Para reducir el tiempo de inactividad de la carga de trabajo, las actualizaciones de software conectado de Distributed Cloud se realizan de forma escalonada. En otras palabras, Google actualiza los nodos trabajadores en cada clúster conectado de Distributed Cloud en etapas. Todos los nodos trabajadores de una etapa de actualización de software se desactivan simultáneamente.
La cantidad de nodos en una etapa de actualización de software se determina de la siguiente manera:
- Implementaciones de hasta 3 racks: Cada etapa es la cantidad total de máquinas en todos los racks dividida por 6 y redondeada al siguiente número entero.
- Implementaciones de 4 o más racks: Cada etapa es la cantidad total de máquinas en todos los racks de la implementación dividida por la cantidad de racks en la implementación.
También tienes la opción de establecer el tamaño de la etapa de actualización de software. En otras palabras, puedes especificar la cantidad de nodos que pueden dejar de funcionar para una actualización de software de forma simultánea en un clúster de Distributed Cloud conectado. Para obtener instrucciones, consulta Administra el tiempo de inactividad de los nodos durante las actualizaciones de software.
Restricciones
Los períodos de mantenimiento tienen las siguientes restricciones:
Un período de mantenimiento por clúster. Solo puedes configurar un único período de mantenimiento por clúster. Si configuras un período de mantenimiento nuevo, se reemplaza el anterior.
Zonas horarias para períodos de mantenimiento. Cuando configuras y visualizas los períodos de mantenimiento, los horarios se muestran de manera diferente según la herramienta que uses, como se detalla en las siguientes secciones.
Cuando configuras períodos de mantenimiento
Cuando usas la marca --maintenance-window más genérica para configurar un período de mantenimiento, no puedes especificar una zona horaria. Cuando usas Google Cloud CLI o la API, se usa UTC para mostrar los horarios. La consola deGoogle Cloud usa la zona horaria local para mostrar las horas.
Cuando usas marcas más detalladas, como --maintenance-window-start, puedes especificar la zona horaria como parte del valor. Si omites la zona horaria, se usa tu zona horaria local. Los horarios siempre se almacenan en UTC.
Cuando visualizas períodos de mantenimiento
Cuando visualizas información sobre tu clúster, puede que las marcas de tiempo de los períodos de mantenimiento se muestren en UTC o en tu zona horaria local, según la manera en la que veas la información:
- Cuando usas la consola de Google Cloud para ver información sobre tu clúster, los horarios siempre se muestran en tu zona horaria local.
- Si usas gcloud CLI para ver información sobre tu clúster, los horarios siempre se muestran en UTC.
En ambos casos, RRULE siempre está en UTC. Eso significa que si, por ejemplo, especificas días de la semana, esos días están en UTC.
Configura períodos de mantenimiento del clúster
Distributed Cloud Connected te permite especificar un período de mantenimiento para cada uno de tus clústeres conectados a Distributed Cloud. Esta ventana le indica a Google que solo actualice el software de Distributed Cloud durante el período y con la frecuencia que especifiques.
Las siguientes reglas rigen los períodos de mantenimiento de los clústeres conectados de Distributed Cloud:
- Si especificas un período de mantenimiento para un clúster de Distributed Cloud conectado, Google actualizará tu software de Distributed Cloud conectado 48 horas después de que se anuncie la actualización a través de las notas de la versión de Distributed Cloud conectado. En la página de notas de la versión, puedes suscribirte al feed RSS de las notas de la versión de Distributed Cloud Connected para mantenerte al tanto de las actualizaciones de software a medida que se lancen.
- La duración mínima de un período de mantenimiento es de seis horas. Puedes especificar un período más largo según la complejidad de tu instalación conectada de Distributed Cloud y tus requisitos comerciales.
- La frecuencia mínima de las actualizaciones de software es de una vez por semana. Puedes especificar períodos de mantenimiento semanales o diarios. Puedes incluir y excluir días específicos.
- Puedes cambiar la programación del período de mantenimiento de un clúster en cualquier momento, excepto cuando ya se haya programado un período de mantenimiento o cuando esté en curso.
- Si la actualización de software no se completa dentro del período especificado, se pausa y, luego, se reanuda durante el siguiente período de mantenimiento programado.
Para obtener instrucciones detalladas, consulta Configura un período de mantenimiento para un clúster.
Reparación de hardware con errores
Cuando Google detecta una falla en el hardware conectado de Distributed Cloud, realizamos una de las siguientes acciones:
En el caso del hardware de Distributed Cloud propiedad de Google, Google intenta programar una visita al sitio en un plazo de tres días hábiles. Para que un técnico autorizado por Google realice el diagnóstico y las reparaciones necesarios, debes otorgarle acceso al hardware conectado de Distributed Cloud.
En el caso del hardware de Distributed Cloud propiedad del cliente, Google te notifica el problema. Debes trabajar con el SI que te entregó el hardware de Distributed Cloud conectado para programar una visita del técnico y realizar el diagnóstico y las reparaciones necesarios.
Si se produce una falla en el hardware conectado a Distributed Cloud, se aplica uno de los siguientes casos según si el hardware conectado a Distributed Cloud usa almacenamiento de disco autoencriptado (SED):
Los racks de Distributed Cloud conectado almacenan datos en unidades que no son SED. Cuando Google o un SI asociado a Google realizan reparaciones en las instalaciones, se quitan todas las unidades de disco de la máquina afectada de Distributed Cloud conectado antes de que comience el servicio y se colocan bajo tu custodia durante la reparación.
Los servidores conectados de Distributed Cloud almacenan datos en unidades SED. Cuando falla una máquina, Google o un SI asociado a Google reemplazan toda la máquina. Antes de que se retire la máquina de tus instalaciones, Google se asegura de que tus datos se hayan borrado de forma segura de todas sus unidades.
Otros puntos de fallo
Eres responsable de mantener los siguientes aspectos de tu instalación de Distributed Cloud que están fuera del control de Google y pueden afectar la disponibilidad de Distributed Cloud Connected:
- Todos los datos que elijas almacenar en el hardware conectado a Distributed Cloud Esto incluye copias de seguridad redundantes que funcionan y la exportación de tus datos antes de devolver el hardware conectado de Distributed Cloud a Google.
- Fuente de alimentación eléctrica
- Temperatura, humedad y enfriamiento ambientales.
- Seguridad física del hardware
- Seguridad de la red local
- Conectividad a Internet y a la red local La conexión de Distributed Cloud debe restablecerse con Google Cloud cada 7 días para actualizar los tokens de seguridad y las claves de encriptación, y sincronizar los datos de administración y registro.