Identifica las cargas de trabajo con aprovisionamiento insuficiente y excesivo

En este documento, se explica cómo identificar las cargas de trabajo con aprovisionamiento insuficiente y excesivo que se ejecutan en clústeres de Google Kubernetes Engine (GKE) mediante estadísticas y recomendaciones. Después de verificar que las cargas de trabajo identificadas se beneficiarían de la recomendación de escalar verticalmente o disminuir la escala, puedes realizar el cambio recomendado para ahorrar costos o aumentar la confiabilidad de tu carga de trabajo. Si es posible, la recomendación incluye ahorros o costos mensuales proyectados. Para obtener más información, consulta Comprende las estimaciones de costos o ahorros.

GKE proporciona estas estadísticas sobre las cargas de trabajo que se ejecutan en clústeres de Autopilot y Standard. GKE también proporciona recomendaciones similares para clústeres completos. Para obtener más información, consulta Identifica clústeres de GKE con aprovisionamiento insuficiente y excesivo.

GKE supervisa tus clústeres y ofrece orientación para optimizar tu uso a través de Active Assist, un servicio que proporciona recomendadores que generan estadísticas y recomendaciones para usar recursos en Google Cloud. Para obtener más información sobre cómo administrar las estadísticas y las recomendaciones, consulta Optimiza el uso de GKE con estadísticas y recomendaciones.

Obtén estadísticas y recomendaciones para cargas de trabajo con aprovisionamiento insuficiente y excesivo

Puedes recibir estas estadísticas y recomendaciones a través de Google Cloud CLI o la API del recomendador. Sigue las instrucciones correspondientes para ver estadísticas y recomendaciones y filtrar con los subtipos WORKLOAD_UNDERPROVISIONED y WORKLOAD_OVERPROVISIONED.

Después de identificar las cargas de trabajo con aprovisionamiento insuficiente o excesivo, consulta las consideraciones para ajustar el tamaño de las cargas de trabajo.

Cómo GKE identifica las cargas de trabajo con aprovisionamiento insuficiente y excesivo

En la siguiente tabla, se describen los indicadores que usa GKE para identificar las cargas de trabajo con aprovisionamiento insuficiente y excesivo que se pueden aumentar o disminuir, y el umbral para cada indicador. Además, en esta tabla, se muestra la acción que te recomendamos que realices en esta situación.

Subtipo Indicador Período de observación Detalles Recomendación
WORKLOAD_UNDERPROVISIONED El uso de CPU o memoria es alto Últimos 15 días Una carga de trabajo tiene aprovisionamiento insuficiente cuando el uso de CPU o memoria es superior al 150% durante al menos el 10% del tiempo en los últimos 15 días. Aumenta la escala de tu carga de trabajo para aumentar la confiabilidad
WORKLOAD_OVERPROVISIONED El uso de CPU o memoria es bajo Últimos 15 días Una carga de trabajo tiene aprovisionamiento excesivo cuando el uso de CPU o memoria es inferior al 50% durante al menos el 90% del tiempo en los últimos 15 días. Disminuye la escala de tu carga de trabajo para ahorrar costos

GKE también usa los siguientes lineamientos para determinar cuándo proporcionar estadísticas y recomendaciones:

  • GKE no genera recomendaciones para la métrica objetivo del ajuste de escala automático horizontal de Pods (HPA), ya que el uso de esta métrica puede causar interferencias.
  • Si el ajuste de escala automático vertical de Pods (VPA) está habilitado, los valores de solicitud se administran automáticamente y GKE no necesita generar una recomendación.
  • Es posible que GKE espere hasta tres días antes de generar recomendaciones para cargas de trabajo nuevas.

Comprende las estimaciones de costos o ahorros

Si es posible, la recomendación de GKE incluye una estimación que proyecta el costo o los ahorros mensuales si ajustas el tamaño de la carga de trabajo. Esta estimación se deriva de los costos de la carga de trabajo, según el promedio ponderado de los valores de solicitud combinados con el costo de CPU y memoria de la carga de trabajo durante los últimos 30 días.

Los costos o ahorros estimados son proyecciones basadas en el gasto anterior y no son una garantía de costos o ahorros futuros.

Para ver estas estimaciones, asegúrate de que se cumpla lo siguiente:

Para obtener más información sobre el costo de todos tus clústeres de GKE, incluido un desglose más detallado basado en espacios de nombres y cargas de trabajo, consulta Obtén estadísticas clave sobre los gastos para la asignación de recursos de GKE y los costos de los clústeres.

Para obtener más información sobre los costos de ejecutar un clúster de GKE, consulta Precios de GKE.

Consideraciones para ajustar el tamaño de las cargas de trabajo

Antes de seguir una recomendación para escalar verticalmente o reducir la escala de una carga de trabajo, considera lo siguiente:

  • Revisa el uso de recursos de la carga de trabajo para ver su rendimiento y si usa más o menos CPU y memoria de lo esperado. Para obtener instrucciones, consulta Analiza las solicitudes de recursos.
  • Es posible que las cargas de trabajo de procesamiento por lotes mantengan intencionalmente un uso alto para lograr eficiencia en los costos. Si los recursos asignados son suficientes para los trabajos por lotes, no necesitas escalar verticalmente la carga de trabajo con uso alto, que se identificó como con aprovisionamiento insuficiente.
  • GKE tiene visibilidad limitada del uso de memoria real de las cargas de trabajo basadas en la máquina virtual de Java (JVM). Usa un análisis adicional antes de aplicar recomendaciones para estos tipos de cargas de trabajo.

Implementa la recomendación para ajustar el tamaño de una carga de trabajo

Puedes ajustar el tamaño de una carga de trabajo para que coincida mejor con el uso de recursos de la carga de trabajo de una de las siguientes maneras:

  • Habilita el ajuste de escala automático vertical de Pods para la carga de trabajo. Para obtener más información, consulta Establece solicitudes de recursos de Pods automáticamente.
  • Cambia las solicitudes y los límites de forma manual según la recomendación:

    • Carga de trabajo con aprovisionamiento insuficiente: Para implementar la recomendación de ajustar el tamaño de una carga de trabajo con aprovisionamiento insuficiente, aumenta las solicitudes y los límites de recursos para la carga de trabajo. Cuando implementas esta recomendación, ayudas a garantizar que tu carga de trabajo siga siendo confiable porque tiene la cantidad adecuada de recursos para sus aplicaciones.
    • Carga de trabajo con aprovisionamiento excesivo: Para implementar la recomendación de ajustar el tamaño de una carga de trabajo con aprovisionamiento excesivo, disminuye las solicitudes y los límites de recursos para la carga de trabajo. Ajusta las asignaciones de CPU y memoria del clúster para que coincidan con las necesidades de tu carga de trabajo. Cuando implementas esta recomendación, ayudas a garantizar que solo uses los recursos que necesitas para ejecutar tu carga de trabajo.

¿Qué sigue?