Métricas de uso de recursos de la flota

En esta página se profundiza en las métricas de utilización de recursos de la flota y del equipo. Para ello, se explica cómo se calculan estas métricas y se ofrecen consejos sobre cómo usarlas para optimizar el uso de los recursos.

Puede consultar estas métricas en los siguientes paneles de control:

Estas métricas describen la eficacia con la que tus clústeres utilizan los recursos disponibles físicamente por los que pagas o los recursos que asignas en el hardware local. Puede usar esta información para comprender la eficacia de la utilización de recursos a gran escala, a nivel de flota o de equipo. Esto puede ayudarte a optimizar el tamaño del clúster y la asignación de recursos en clústeres y espacios de nombres, o bien a optimizar la forma en que los equipos de aplicaciones solicitan y reservan recursos.

Usar métricas de utilización de recursos

Los siguientes consejos pueden ayudarte a usar las métricas de la consola para identificar y solucionar problemas:

  • Si la métrica Uso total de CPU, memoria o disco de tu flota indica un uso inesperadamente alto o bajo durante los últimos siete días, consulta siempre el gráfico Uso de CPU, memoria o disco por flota correspondiente para evaluar si el uso inesperado es constante o se debe a picos de uso.
  • Si Uso máximo de CPU, memoria o disco por clúster indica que hay clústeres que se comportan de forma diferente al resto, investiga esos clústeres concretos con más detenimiento. Si es posible, cambia el tamaño de los clústeres.
  • Si Uso máximo de CPU, memoria o disco por espacio de nombres muestra un pico inesperado en los últimos siete días, investiga si una carga de trabajo específica está provocando el pico. Una posible solución sería redistribuir las cargas de trabajo entre los recursos.
  • Uso de CPU, memoria y disco por flota: te permite observar la proporción entre los recursos usados y los solicitados. Una gran diferencia entre ambos puede significar que los equipos de aplicaciones solicitan y reservan demasiados recursos.

Información sobre las métricas de utilización de recursos

Las siguientes métricas se proporcionan en los paneles de control de resumen de GKE, de flota y de equipo. Se calculan a partir de la información de Cloud Monitoring de los clústeres de tu flota.

Puede ver las métricas a nivel de flota en los paneles de control de GKE y de resumen de la flota. Las métricas a nivel de equipo están disponibles en los paneles de control de GKE y de resumen del equipo.

Métricas de CPU

  • Utilización total de la CPU:
    • En el caso de las métricas a nivel de flota, se calcula la media de todos los puntos en el tiempo de un periodo determinado, donde el punto en el tiempo es una proporción entre los recursos asignables y los utilizados en todos los clústeres registrados en una flota.
      • Asignable: la cantidad de CPU asignada a todos los nodos de todos los clústeres registrados en una flota. Se calcula a partir de la métrica node/cpu/allocatable_cores.
      • Usado: la cantidad de CPU utilizada por todos los contenedores de todos los clústeres registrados en una flota. Se calcula a partir de la métrica container/cpu/core_usage_time.
    • En el panel de control Monitorización, se muestra la media de todos los puntos de un periodo determinado. Un punto es la proporción entre los recursos solicitados y los utilizados en todos los espacios de nombres asociados a un ámbito de equipo.
      • Solicitado: la cantidad de CPU solicitada por todos los contenedores de todos los espacios de nombres asociados a un ámbito de equipo. Se calcula a partir de la métrica container/cpu/request_cores.
      • Usado: la cantidad de CPU utilizada por todos los contenedores de todos los espacios de nombres asociados a un ámbito de equipo. Calculada a partir de la métrica container/cpu/core_usage_time.
  • Uso de CPU por flota o equipo:
    • En el nivel de flota, la relación entre los recursos usados, solicitados y asignados.
      • Usado: la cantidad de CPU utilizada por todos los contenedores de todos los clústeres registrados en una flota. Se calcula a partir de la métrica container/cpu/core_usage_time.
      • Solicitado: la cantidad de CPU solicitada por todos los contenedores de todos los clústeres registrados en una flota. Calculada a partir de la métrica container/cpu/request_cores.
      • Asignable: la cantidad de CPU asignada a todos los nodos de todos los clústeres registrados en una flota. Se calcula a partir de la métrica node/cpu/allocatable_cores.
    • En el nivel de equipo, la relación entre el límite de recursos y los recursos usados y solicitados.
      • Usado: la cantidad de CPU utilizada por todos los contenedores de todos los espacios de nombres asociados a un ámbito de equipo. Calculada a partir de la métrica container/cpu/core_usage_time.
      • Solicitado: la cantidad de CPU solicitada por todos los contenedores de todos los espacios de nombres asociados a un ámbito de equipo. Se calcula a partir de la métrica container/cpu/request_cores.
      • Límite: la cantidad máxima de CPU disponible para todos los contenedores de todos los espacios de nombres asociados a un ámbito de equipo. Se calcula a partir de la métrica container/cpu/limit_cores.
  • Uso de CPU principal por clúster: lista de clústeres ordenada por la media de todos los puntos de un periodo determinado, donde cada punto es una proporción entre los recursos asignables y los usados de un clúster concreto.
    • Asignable: la cantidad de CPU asignada a todos los nodos de un clúster. Se calcula a partir de la métrica node/cpu/allocatable_cores.
    • Usado: la cantidad de CPU utilizada por todos los contenedores de un clúster. Se calcula a partir de la métrica container/cpu/core_usage_time.
  • Uso de CPU principal por espacio de nombres: lista de espacios de nombres ordenada por la media de todos los puntos en el tiempo de un periodo determinado, donde el punto en el tiempo es una proporción entre los recursos usados y los solicitados de un espacio de nombres concreto.
    • Usado: la cantidad de CPU utilizada por todos los contenedores de un espacio de nombres. Se calcula a partir de la métrica container/cpu/core_usage_time.
    • Solicitado: la cantidad de CPU solicitada por todos los contenedores de un espacio de nombres. Se calcula a partir de la métrica container/cpu/request_cores.

Métricas de memoria

  • Utilización total de la memoria:
    • En el caso de las métricas a nivel de flota, se refiere a la media de todos los puntos en el tiempo de un periodo determinado, donde el punto en el tiempo es una proporción entre los recursos asignables y los utilizados en todos los clústeres que pertenecen a una flota.
      • Asignable: la cantidad de memoria asignada a todos los nodos de todos los clústeres registrados en una flota. Calculada a partir de la métrica node/memory/allocatable_byte.
      • Usada: la cantidad de memoria no desalojable usada por todos los contenedores de todos los clústeres registrados en una flota. Se calcula a partir de la métrica container/memory/used_bytes.
    • En el caso de las métricas a nivel de equipo, se refiere a la media de todos los puntos en el tiempo de un periodo determinado, donde el punto en el tiempo es una proporción entre los recursos solicitados y utilizados en todos los espacios de nombres que pertenecen a un ámbito de equipo.
      • Solicitado: la cantidad de memoria solicitada por todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/memory/request_bytes.
      • Usado: la cantidad de memoria no desalojable usada por todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/memory/used_bytes.
  • Uso de memoria por flota o equipo:
    • En el nivel de flota, la relación entre los recursos usados, solicitados y asignados.
      • Usada: la cantidad de memoria no desalojable usada por todos los contenedores de todos los clústeres registrados en una flota. Se calcula a partir de la métrica container/memory/used_bytes.
      • Solicitada: la cantidad de memoria solicitada por todos los contenedores de todos los clústeres registrados en una flota. Calculada a partir de la métrica container/memory/request_bytes.
      • Asignable: la cantidad de memoria asignada a todos los nodos de todos los clústeres registrados en una flota. Calculada a partir de la métrica node/memory/allocatable_byte.
    • En el nivel de equipo, la relación entre el límite de recursos y los recursos usados y solicitados.
      • Usado: la cantidad de memoria no desalojable usada por todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/memory/used_bytes.
      • Solicitado: la cantidad de memoria solicitada por todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/memory/request_bytes.
      • Límite: la cantidad máxima de memoria disponible para todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/memory/limit_bytes.
  • Utilización de memoria por clúster: lista de clústeres ordenada por la media de todos los puntos de un periodo determinado, donde cada punto es una proporción entre los recursos asignables y los utilizados de un clúster concreto.
    • Asignable: la cantidad de memoria asignada a todos los nodos de un clúster. Se calcula a partir de la métrica node/memory/allocatable_byte.
    • Usada: la cantidad de memoria no desalojable que usan todos los contenedores de un clúster. Se calcula a partir de la métrica container/memory/used_bytes.
  • Uso de memoria máximo por espacio de nombres: lista de espacios de nombres ordenada por la media de todos los puntos en el tiempo de un periodo determinado, donde el punto en el tiempo es una proporción entre los recursos usados y los solicitados de un espacio de nombres concreto.
    • Usado: la cantidad de memoria no expulsable utilizada por todos los contenedores de un espacio de nombres. Se calcula a partir de la métrica container/memory/used_bytes.
    • Solicitada: la cantidad de memoria solicitada por todos los contenedores de un espacio de nombres. Se calcula a partir de la métrica container/memory/request_bytes.

Métricas de disco

  • Utilización total del disco:
    • En el caso de las métricas a nivel de flota, se trata de la media de todos los puntos de un periodo determinado, donde cada punto es una proporción entre los recursos asignables y los utilizados en todos los clústeres que pertenecen a una flota.
      • Asignable: la cantidad de almacenamiento efímero local asignado a todos los nodos de todos los clústeres registrados en una flota. Se calcula a partir de la métrica node/ephemeral_storage/allocatable_bytes.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores de todos los clústeres registrados en una flota. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
    • En el caso de las métricas a nivel de equipo, se refiere a la media de todos los puntos en el tiempo de un periodo determinado, donde el punto en el tiempo es una proporción entre los recursos solicitados y utilizados en todos los espacios de nombres que pertenecen a un ámbito de equipo.
      • Solicitado: la cantidad de almacenamiento efímero local solicitada por todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/ephemeral_storage/request_bytes.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
  • Uso del disco por flota o equipo:
    • En el nivel de flota, la relación entre los recursos usados, solicitados y asignados.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores de todos los clústeres registrados en una flota. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
      • Solicitado: la cantidad de almacenamiento efímero local solicitada por todos los contenedores de todos los clústeres registrados en una flota. Se calcula a partir de la métrica container/ephemeral_storage/request_bytes.
      • Asignable: la cantidad de almacenamiento efímero local asignado a todos los nodos de todos los clústeres registrados en una flota. Se calcula a partir de la métrica node/ephemeral_storage/allocatable_bytes.
    • En el nivel de equipo, la relación entre el límite de recursos y los recursos usados y solicitados.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
      • Solicitado: la cantidad de almacenamiento efímero local solicitada por todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/ephemeral_storage/request_bytes.
      • Límite: cantidad máxima de almacenamiento efímero local disponible para todos los contenedores de todos los espacios de nombres asociados a un ámbito. Se calcula a partir de la métrica container/ephemeral_storage/limit_bytes.
  • Utilización de disco principal por clúster: lista de clústeres ordenada por la media de todos los puntos de un periodo determinado, donde cada punto es una proporción entre los recursos asignables y los utilizados de un clúster concreto.
  • Utilización de disco principal por espacio de nombres: lista de espacios de nombres ordenada por la media de todos los puntos en el tiempo de un periodo determinado, donde el punto en el tiempo es una proporción entre los recursos usados y los solicitados de un espacio de nombres concreto.

Distribución de errores por espacio de nombres (solo a nivel de equipo)

Lista de espacios de nombres ordenada por el mayor número de registros de errores en un periodo determinado. Los registros se recogen de Cloud Logging.

Reinicia la distribución de recuentos por espacio de nombres (solo a nivel de equipo)

Lista de espacios de nombres ordenada por el mayor número de reinicios de contenedores en un periodo determinado. Se calcula a partir de la métrica container/restart_count.

Solución de problemas

No se cargan las métricas de los clústeres nuevos

Si has creado clústeres nuevos, en función del periodo que selecciones, puede que veas No Data en todo el panel de control Monitorización o que veas métricas. Por ejemplo, si has creado un clúster en la última hora y seleccionas un periodo de 1 hora o 6 horas, el panel de control puede devolver algunas métricas de tus cargas de trabajo. Sin embargo, si seleccionas un periodo de 1 día o más, es posible que veas el mensaje No data en todo el panel de control.

Esto se debe a que Cloud Monitoring recoge datos en diferentes periodos (intervalos) para diferentes ventanas de tiempo. En las ventanas de tiempo de 1 hora y 6 horas, los datos se recogen en periodos de 1 minuto. Por lo tanto, si tu clúster lleva unos minutos activo, verás métricas de estas ventanas de tiempo.

En las ventanas de tiempo de 1 día y 1 semana, Cloud Monitoring recoge datos en periodos de 1 hora. Si tu clúster lleva menos de una hora activo, es posible que no veas datos en estas ventanas de tiempo.

Si se produce este error, comprueba el panel de control después de que haya transcurrido más tiempo desde que creaste el clúster.