Identifica las cargas de trabajo con aprovisionamiento insuficiente y excesivo

En este documento, se explica cómo identificar las cargas de trabajo con aprovisionamiento insuficiente y excesivo que se ejecutan en clústeres de Google Kubernetes Engine (GKE) con estadísticas y recomendaciones. Después de verificar que las cargas de trabajo identificadas se beneficiarían con la recomendación de escalar verticalmente o reducir la escala, puedes realizar el cambio recomendado para ahorrar costos o aumentar la confiabilidad de tu carga de trabajo. Si es posible, la recomendación incluye los ahorros o el costo mensuales proyectados. Para obtener más información, consulta Cómo comprender las estimaciones de costos o ahorros.

GKE proporciona estas estadísticas sobre las cargas de trabajo que se ejecutan en clústeres de Autopilot y Standard. GKE también proporciona recomendaciones similares para clústeres completos. Para obtener más información, consulta Cómo identificar clústeres de GKE con capacidad insuficiente o excesiva.

GKE supervisa tus clústeres y ofrece orientación para optimizar el uso a través de Active Assist, un servicio que proporciona recomendadores que generan estadísticas y recomendaciones para usar recursos en Google Cloud. Para obtener más información sobre cómo administrar las estadísticas y las recomendaciones, consulta Optimiza el uso de GKE con estadísticas y recomendaciones.

Obtén estadísticas y recomendaciones para las cargas de trabajo con aprovisionamiento insuficiente y excesivo

GKE muestra estas estadísticas y recomendaciones en las siguientes ubicaciones de la consola de Google Cloud después de observar el comportamiento específico que se analiza en la siguiente sección:

Las recomendaciones tienen los siguientes títulos en la página Cargas de trabajo:

  • Cargas de trabajo con exceso de aprovisionamiento: "Disminuye las solicitudes de recursos para reducir los costos"
  • Cargas de trabajo con recursos insuficientes: "Aumenta las solicitudes de recursos para mejorar la confiabilidad"

También puedes recibir todo tipo de estadísticas y recomendaciones a través de Google Cloud CLI o la API del recomendador. Para encontrar estos tipos específicamente, sigue las instrucciones para ver estadísticas y recomendaciones y filtra con los subtipos WORKLOAD_UNDERPROVISIONED y WORKLOAD_OVERPROVISIONED.

Después de identificar las cargas de trabajo con aprovisionamiento insuficiente o excesivo, consulta las consideraciones para ajustar el tamaño de las cargas de trabajo.

Cómo GKE identifica las cargas de trabajo con aprovisionamiento insuficiente y excesivo

En la siguiente tabla, se describen los indicadores que usa GKE para identificar las cargas de trabajo con capacidad insuficiente y excesiva que se pueden aumentar o reducir, y el umbral para cada indicador. Además, en esta tabla, se muestra la acción que te recomendamos que realices en esta situación.

Subtipo Indicador Período de observación Detalles Recomendación
WORKLOAD_UNDERPROVISIONED El uso de CPU o memoria es alto Últimos 15 días Una carga de trabajo tiene un aprovisionamiento insuficiente cuando el uso de CPU o memoria es superior al 150% durante al menos el 10% del tiempo en los últimos 15 días. Cómo escalar tu carga de trabajo para aumentar la confiabilidad
WORKLOAD_OVERPROVISIONED El uso de CPU o memoria es bajo. Últimos 15 días Una carga de trabajo se sobreaprovisiona cuando el uso de CPU o memoria es inferior al 50% durante al menos el 90% del tiempo en los últimos 15 días. Reduce la escala de tu carga de trabajo para ahorrar costos

GKE también usa los siguientes lineamientos para determinar cuándo proporcionar estadísticas y recomendaciones:

  • GKE no genera recomendaciones para la métrica objetivo del ajuste de escala automático de Pods horizontal (HPA) porque el uso de esta métrica puede causar interferencias.
  • Si el ajuste de escala automático vertical de Pods (VPA) está habilitado, los valores de solicitud se administran automáticamente y GKE no necesita generar una recomendación.
  • Es posible que GKE espere hasta tres días antes de generar recomendaciones para las cargas de trabajo nuevas.

Comprende las estimaciones de costos o ahorros

Si es posible, la recomendación de GKE incluye una estimación que proyecta el costo o los ahorros mensuales si ajustas el tamaño de la carga de trabajo. Esta estimación se deriva de los costos de la carga de trabajo, según el promedio ponderado de los valores de solicitud combinados con el costo de CPU y memoria de la carga de trabajo durante los últimos 30 días.

Los costos o ahorros estimados son proyecciones basadas en inversiones anteriores y no son una garantía de costos o ahorros futuros.

Para ver estas estimaciones, asegúrate de que se cumplan las siguientes condiciones:

Para obtener más información sobre el costo de todos tus clústeres de GKE, incluido un desglose más detallado basado en espacios de nombres y cargas de trabajo, consulta Obtén estadísticas clave sobre el gasto para la asignación de recursos y los costos de los clústeres de GKE.

Para obtener más información sobre los costos de ejecutar un clúster de GKE, consulta Precios de GKE.

Consideraciones para ajustar el tamaño de las cargas de trabajo

Antes de seguir una recomendación para aumentar o reducir la escala de una carga de trabajo, ten en cuenta lo siguiente:

  • Revisa el uso de recursos de la carga de trabajo para ver su rendimiento y si usa más o menos CPU y memoria de lo esperado. Para obtener instrucciones, consulta Analiza las solicitudes de recursos.
  • Es posible que las cargas de trabajo de procesamiento por lotes mantengan intencionalmente una utilización alta para lograr eficiencia en los costos. Si los recursos asignados son suficientes para los trabajos por lotes, no es necesario aumentar la escala de la carga de trabajo con un uso elevado, que se identificó como con una asignación insuficiente.
  • GKE tiene visibilidad limitada del uso real de la memoria de las cargas de trabajo basadas en la máquina virtual de Java (JVM). Aplica un análisis adicional antes de aplicar recomendaciones para estos tipos de cargas de trabajo.

Implementa la recomendación para ajustar el tamaño de una carga de trabajo

Puedes ajustar el tamaño de una carga de trabajo para que coincida mejor con el uso de recursos de la carga de trabajo de una de las siguientes maneras:

  • Habilita el ajuste de escala automático vertical de Pods para la carga de trabajo. Para obtener más información, consulta Establece solicitudes de recursos de Pods automáticamente.
  • Cambia las solicitudes y los límites manualmente según la recomendación:

    • Carga de trabajo con recursos insuficientes: Para implementar la recomendación de redimensionar una carga de trabajo con recursos insuficientes, aumenta las solicitudes y los límites de recursos para la carga de trabajo. Cuando implementas esta recomendación, ayudas a garantizar que tu carga de trabajo siga siendo confiable, ya que tiene la cantidad adecuada de recursos para sus aplicaciones.
    • Carga de trabajo con exceso de aprovisionamiento: Para implementar la recomendación de ajustar el tamaño de una carga de trabajo con exceso de aprovisionamiento, disminuye las solicitudes y los límites de recursos para la carga de trabajo. Ajusta las asignaciones de CPU y memoria del clúster para que coincidan con las necesidades de tu carga de trabajo. Cuando implementas esta recomendación, ayudas a garantizar que solo uses los recursos que necesitas para ejecutar tu carga de trabajo.

¿Qué sigue?