Antes de que se produzca el evento de capacidad máxima, administra y optimiza los recursos que usan tus cargas de trabajo de Google Cloud . Esto implica ajustar el tamaño de los recursos según el uso y la demanda reales, usar el escalado automático para la asignación dinámica de recursos y revisar las recomendaciones de arquitectura y seguridad. Tanto Cloud Monitoring como el recomendador (Active Assist) pueden ayudarte a identificar oportunidades para optimizar tus recursos en la nube. Con estas herramientas, puedes obtener estadísticas sobre el uso de recursos y tomar decisiones fundamentadas antes del evento.
Consulta las prácticas recomendadas de Google Cloud
Muchos problemas relacionados con los eventos de capacidad máxima se pueden evitar con el seguimiento de las prácticas recomendadas para el producto de Google Cloud que usas. Estos son algunos ejemplos de guías de prácticas recomendadas:
| General | |
| BigQuery | |
| Cloud Storage | |
| Compute Engine | |
| Dataflow | |
| Dataproc | |
| Google Kubernetes Engine |
Revisa la escalabilidad
El escalado automático puede garantizar que tus aplicaciones basadas en la nube tengan los recursos que necesitan para controlar las cargas de trabajo variables, a la vez que evita el aprovisionamiento excesivo y los costos innecesarios. Google Cloud ofrece varias opciones de escalado automático específicas del producto, incluidas las siguientes:
- Los grupos de instancias administrados (MIG) de Compute Engine son grupos de VMs que se administran y escalan como una sola entidad. Con los MIG, puedes definir políticas de escalado automático que especifiquen la cantidad mínima y máxima de VMs que se deben mantener en el grupo y las condiciones que activan el escalado automático.
- El escalado automático de Google Kubernetes Engine (GKE) ajusta de forma dinámica los recursos del clúster para satisfacer las necesidades de tu aplicación. Ofrece herramientas que pueden optimizar el uso de recursos, garantizar el rendimiento de las aplicaciones y simplificar la administración de clústeres.
- Cloud Run ofrece un escalado automático integrado, que ajusta automáticamente la cantidad de instancias según el tráfico entrante.
Antes del evento, te recomendamos que escales verticalmente de forma manual. Aunque es posible que tengas configurado el escalado automático, debido a la velocidad del tráfico de eventos, es posible que el escalado automático no pueda satisfacer la demanda. Por lo tanto, prepara los recursos con anticipación, incluidos los siguientes:
- Máquinas virtuales
- Caché si deseas precargar
- Componentes sin servidores para evitar inicios en frío
Revisa las recomendaciones de Active Assist
Active Assist se refiere a la cartera de herramientas que se usan en Google Cloud para generar recomendaciones y estadísticas que te ayudarán a optimizar tus proyectos de Google Cloud . Para obtener más información, consulta Qué es Active Assist.
Revisa las versiones de tu producto
Asegúrate de que todos tus productos y servicios en la nube estén actualizados con la versión estable más reciente.
Revisa las alertas y los paneles
Identifica y aborda los problemas de forma proactiva evaluando las alertas y los paneles que se te proporcionan a través de las herramientas de Google Cloud Observability y las soluciones de terceros.
Consulta tus métricas, registros y seguimientos de Google Cloud Observability para obtener estadísticas sobre la utilización de recursos, las características de rendimiento y el estado general de tus recursos. Supervisa las métricas importantes que se alinean con los indicadores de estado del sistema, como el uso de CPU, el uso de memoria, el tráfico de red, la E/S de disco y los tiempos de respuesta de las aplicaciones. También debes considerar las métricas específicas de la empresa. Con el seguimiento de estas métricas, podrás identificar posibles cuellos de botella, problemas de rendimiento y restricciones de recursos. Además, puedes configurar alertas para notificar de forma proactiva a los equipos pertinentes sobre posibles problemas o anomalías.
En el caso de las alertas, enfócate en las métricas esenciales, establece umbrales adecuados para minimizar la fatiga por alertas y garantiza respuestas oportunas a los problemas importantes. Este enfoque específico te permite mantener de forma proactiva la confiabilidad de la carga de trabajo. Para obtener más información, consulta la descripción general de las alertas.