Cuando administras eventos de temporada alta o de tráfico alto en la nube, hay tres fases clave:
- Preparación: Completa actividades y tareas con el objetivo de prepararte para tu evento, incluida la revisión de la arquitectura, la planificación de la capacidad y la creación de reservas.
- Ejecución: Cuando comience tu evento, supervísalo de cerca y reacciona según corresponda.
- Análisis: Después de que finalice tu evento, analiza qué salió bien, qué no y cómo mejorar los eventos futuros.
Debes comprender y seguir ciertas prácticas recomendadas durante estas fases para que puedas entregar tus servicios con o sin un tiempo de inactividad mínimo, y sin degradación del rendimiento ni de la experiencia del usuario durante el evento.
Preparación: Detalla tu proceso de planificación de eventos
Durante la fase de preparación de un evento de capacidad máxima, comunícate con tu equipo de cuentas o TAM para que te ayuden a revisar la arquitectura, crear diagramas, cronogramas y listas de tareas de lanzamiento, verificar las cuotas de servicio según tu perfil de tráfico previsto y determinar el impacto general en tus proyectos.
La planificación debe comenzar con suficiente anticipación a la fecha del evento. En algunos casos, es posible que debas comenzar a planificar con meses de anticipación mientras tu servicio aún está en desarrollo. Reúne un equipo que pueda ayudarte a revisar el flujo de trabajo del evento propuesto, el público esperado, tus requisitos y criterios de éxito, y la cadena de entrega de contenido multimedia de extremo a extremo. La fase de preparación debe incluir evaluaciones de riesgos, planificación de mitigación y una revisión de la preparación operativa para garantizar que tu flujo de trabajo esté bien diseñado.
Para obtener más información, consulta el Google Cloud Framework de arquitectura que proporciona recomendaciones para ayudar a arquitectos, desarrolladores, administradores y otros profesionales de la nube a la hora de diseñar y operar una topología en la nube que sea segura, eficiente, resiliente, de alto rendimiento y rentable.
Ejecución: Realiza una supervisión y reacciona durante la ejecución
Cuando comience la temporada alta o el evento de lanzamiento, deberás supervisar de cerca la actividad y reaccionar según sea necesario. Una vez que hayas configurado la supervisión, las alertas y el acceso en la fase de preparación, podrás supervisar el tráfico, los registros y los niveles de cuota esenciales para la empresa, y usar esta información para determinar las causas raíz y resolver los problemas rápidamente. Para obtener más información, consulta Revisa las alertas y los paneles.
Si ocurre algún problema, un proceso de gestión de incidentes y derivación bien definido es clave para reducir el esfuerzo y el tiempo que lleva abordar y resolver el problema. Si aún no lo hiciste, establece un proceso de gestión de incidentes. Para obtener más información, consulta Prepárate para resolver problemas durante el evento.
Análisis: Revisa y documenta tu análisis
Cuando finalice la temporada alta o el evento de lanzamiento, revisa y analiza el evento, y documenta las lecciones aprendidas para poder aplicarlas a tu próximo evento importante.
Enfócate en las siguientes áreas:
Resumen de la línea de tiempo: Captura cuándo comenzó a aumentar tu tráfico y los eventos clave (picos) durante el período del evento. Identifica cuándo surgieron los problemas, si es que hubo alguno.
Análisis de la causa raíz: Investiga los problemas que ocurrieron. ¿Hay algo que tú o Google Cloud podrían haber hecho de otra manera? ¿Es algo para tener en cuenta la próxima vez? Documenta las lecciones aprendidas y los pasos necesarios para mejorar en el futuro.
Comparar las predicciones con los valores reales: Analiza tu predicción de tráfico en comparación con el tráfico real que registraste. ¿En dónde se necesitaron recursos adicionales? ¿En qué casos los recursos fueron infrautilizados o innecesarios?
Retrospectiva: Revisa y comparte la información anterior con las principales partes interesadas. Promueve una cultura sin culpas, en la que se supone que todos los involucrados tuvieron buenas intenciones y te enfocas en identificar las causas que contribuyeron al problema sin señalar a ningún individuo o equipo.