En esta página, se describen las prácticas recomendadas para garantizar la alta disponibilidad de tu instalación de Google Distributed Cloud. Distributed Cloud no ofrece un Acuerdo de Nivel de Servicio (ANS) y solo proporciona el objetivo de nivel de servicio (SLO) que se describe en esta página.
Elige e implementa el nivel de disponibilidad
Debes elegir el nivel de disponibilidad para tus cargas de trabajo de Distributed Cloud que mejor se adapte a los requisitos de tu empresa. Por ejemplo, una aplicación de autopago en una tienda minorista tiene un riesgo de disponibilidad mucho menor que una implementación de RAN perimetral de un operador de red móvil.
La disponibilidad del destino es directamente proporcional a la capacidad de recursos de reserva de Distributed Cloud que reservas para emergencias. En la siguiente tabla, se describe esta relación. Estas estimaciones no incluyen el tiempo de inactividad programado con un período de mantenimiento.
El software de Distributed Cloud conectado consume algunos recursos en cada máquina física. El importe varía según la configuración específica de tu implementación conectada de Distributed Cloud. Google recomienda que realices pruebas comparativas de tu implementación de Distributed Cloud Connected para medir esta cantidad y tenerla en cuenta cuando planifiques la distribución de tu carga de trabajo.
| Factor de forma de GDC Edge | Capacidad en uso | Capacidad reservada | Disponibilidad de objetivos |
|---|---|---|---|
| Rack de GDC Edge (clúster único de 6 máquinas) |
83.33% | 16.67% | 99.9% |
| Rack de GDC Edge (clúster único de 6 máquinas) |
100% | 0% | 93.5% |
| Servidor de GDC Edge (clúster único de 3 máquinas) |
66.6% | 33.3% | 99.9% |
Es posible que experimentes una pérdida repentina de capacidad debido a una falla de hardware o a un nodo que requiere un reinicio. Para prepararte, debes diseñar tus cargas de trabajo teniendo en cuenta las cuotas de recursos, de modo que siempre tengas capacidad disponible en cada nodo de Distributed Cloud que cumpla con el nivel de disponibilidad que elegiste.
Por ejemplo, para lograr una disponibilidad objetivo del 99.9% en una implementación de Distributed Cloud Rack, debes configurar tus cargas de trabajo de modo que una de las seis máquinas físicas de cada clúster de Distributed Cloud esté disponible como copia de seguridad.
Cómo usar el modo de supervivencia
Distributed Cloud te permite crear clústeres que usan un plano de control local que se ejecuta en tu hardware de Distributed Cloud. Estos clústeres permiten que las cargas de trabajo sigan ejecutándose cuando se pierde la conexión con Google Cloud . Para obtener más información, consulta el modo de supervivencia de Distributed Cloud.
Información sobre las actualizaciones de software y los períodos de mantenimiento
Google actualiza el software de Distributed Cloud con regularidad. Estas actualizaciones de software son obligatorias y no puedes inhabilitarlas. Distributed Cloud te permite especificar ventanas de mantenimiento individuales para cada uno de tus clústeres de Distributed Cloud.
Para mitigar posibles interrupciones transitorias en tus cargas de trabajo, los períodos de mantenimiento te permiten controlar cuándo pueden ocurrir las actualizaciones automáticas de los planos de control y los nodos. Los períodos de mantenimiento son útiles en distintos tipos de situaciones, por ejemplo:
- Horas de menor demanda: para disminuir las posibilidades de que ocurran tiempos de inactividad, programa actualizaciones automáticas durante las horas de menor demanda, que es cuando el tráfico es reducido.
- De guardia: asegúrate de que las actualizaciones se realizan durante el horario laboral para que alguien pueda supervisar y administrar cualquier problema inesperado.
- Actualizaciones de varios clústeres: implementa actualizaciones en varios clústeres en diferentes regiones, una por una y en intervalos específicos.
Además de las actualizaciones automáticas, es posible que Google necesite realizar otras tareas de mantenimiento. En esos casos, respeta el período de mantenimiento de un clúster cuando es posible.
Si la ejecución de las tareas excede el período de mantenimiento, Distributed Cloud intenta pausarlas. Luego, intenta reanudar esas tareas durante el siguiente período de mantenimiento.
Distributed Cloud se reserva el derecho de lanzar actualizaciones de emergencia sin planificar fuera de los períodos de mantenimiento. Además, las actualizaciones obligatorias de software obsoleto o desactualizado pueden ocurrir de manera automática fuera de los períodos de mantenimiento.
También puedes actualizar tu clúster de forma manual en cualquier momento. Las actualizaciones iniciadas de forma manual ignoran cualquier período de mantenimiento y comienzan de inmediato.
Si deseas obtener información para configurar un período de mantenimiento en un clúster nuevo o existente, consulta Configura un período de mantenimiento.
Restricciones
Los períodos de mantenimiento tienen las siguientes restricciones:
Un período de mantenimiento por clúster. Solo puedes configurar un único período de mantenimiento por clúster. Si configuras un período de mantenimiento nuevo, se reemplaza el anterior.
Zonas horarias para períodos de mantenimiento. Cuando configuras y visualizas los períodos de mantenimiento, los horarios se muestran de manera diferente según la herramienta que uses, como se detalla en las siguientes secciones.
Cuando configuras períodos de mantenimiento
Cuando usas la marca --maintenance-window más genérica para configurar un período de mantenimiento, no puedes especificar una zona horaria. Cuando usas Google Cloud CLI o la API, se usa UTC para mostrar los horarios. La consola deGoogle Cloud usa la zona horaria local para mostrar las horas.
Cuando usas marcas más detalladas, como --maintenance-window-start, puedes especificar la zona horaria como parte del valor. Si omites la zona horaria, se usa tu zona horaria local. Los horarios siempre se almacenan en UTC.
Cuando visualizas períodos de mantenimiento
Cuando visualizas información sobre tu clúster, puede que las marcas de tiempo de los períodos de mantenimiento se muestren en UTC o en tu zona horaria local, según la manera en la que veas la información:
- Cuando usas la consola de Google Cloud para ver información sobre tu clúster, los horarios siempre se muestran en tu zona horaria local.
- Si usas gcloud CLI para ver información sobre tu clúster, los horarios siempre se muestran en UTC.
En ambos casos, RRULE siempre está en UTC. Eso significa que si, por ejemplo, especificas días de la semana, esos días están en UTC.
Configura períodos de mantenimiento del clúster
Distributed Cloud te permite especificar un período de mantenimiento para cada uno de tus clústeres de Distributed Cloud. Esta ventana le indica a Google que solo actualice el software de Distributed Cloud durante el período y con la frecuencia que especifiques.
Las siguientes reglas rigen los períodos de mantenimiento de los clústeres de Distributed Cloud:
- Si especificas un período de mantenimiento para un clúster de Distributed Cloud, Google actualizará tu software de Distributed Cloud 48 horas después de que se anuncie la actualización a través de las notas de la versión de Distributed Cloud. En la página de notas de la versión, puedes suscribirte al feed RSS de notas de la versión de Distributed Cloud para mantenerte informado sobre las actualizaciones de software a medida que se lancen.
- La duración mínima de un período de mantenimiento es de seis horas. Puedes especificar un período más largo según la complejidad de tu instalación de Distributed Cloud y tus requisitos comerciales.
- La frecuencia mínima de las actualizaciones de software es de una vez por semana. Puedes especificar períodos de mantenimiento semanales o diarios. Puedes incluir y excluir días específicos.
- Puedes cambiar la programación del período de mantenimiento de un clúster en cualquier momento, excepto cuando ya se haya programado un período de mantenimiento o cuando esté en curso.
- Si la actualización de software no se completa dentro del período especificado, se pausa y, luego, se reanuda durante el siguiente período de mantenimiento programado.
Para obtener instrucciones detalladas, consulta Configura un período de mantenimiento para un clúster.
Reparación de hardware con errores
Cuando Google detecta una falla en el hardware de Distributed Cloud, intenta programar una visita al sitio en un plazo de tres días hábiles. Para que un técnico autorizado por Google realice el diagnóstico y las reparaciones necesarios, debes otorgarle acceso al hardware de Distributed Cloud.
Si se produce una falla en el hardware de Distributed Cloud, se aplica uno de los siguientes escenarios, según si el hardware de Distributed Cloud usa almacenamiento de disco autoencriptado (SED):
Los racks de Distributed Cloud almacenan datos en unidades que no son SED. Cuando Google realiza reparaciones en las instalaciones, se quitan todas las unidades de disco de la máquina de Distributed Cloud afectada antes de que comience el servicio y se colocan bajo tu custodia durante la reparación.
Los servidores de Distributed Cloud almacenan datos en unidades SED. Cuando falla una máquina, Google la reemplaza por completo. Antes de que se retire la máquina de tus instalaciones, Google se asegura de que tus datos se hayan borrado de forma segura de todas sus unidades.
Otros puntos de fallo
Eres responsable de mantener los siguientes aspectos de tu instalación de Distributed Cloud que están fuera del control de Google y pueden afectar la disponibilidad de Distributed Cloud:
- Todos los datos que elijas almacenar en el hardware de Distributed Cloud Esto incluye copias de seguridad redundantes que funcionan y la exportación de tus datos antes de devolver el hardware de Distributed Cloud a Google.
- Fuente de alimentación eléctrica
- Temperatura, humedad y enfriamiento ambientales.
- Seguridad física del hardware
- Seguridad de la red local
- Conectividad a Internet y a la red local:
- En el caso de los clústeres del plano de control de la nube, Distributed Cloud requiere una conexión constante a Google Cloud y no puede funcionar sin ella.
- En el caso de los clústeres del plano de control local, Distributed Cloud debe volver a conectarse a Google Cloud cada 7 días para actualizar los tokens de seguridad y las claves de encriptación, y sincronizar los datos de administración y registro.