Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Redimensiona tus cargas de trabajo de GKE a gran escala

Estándar

En este instructivo, se muestra cómo ajustar el tamaño de las cargas de trabajo de Google Kubernetes Engine (GKE) con recomendaciones de VPA y métricas de uso.

Comprende por qué es importante el redimensionamiento de los recursos

El aprovisionamiento insuficiente puede privar tus contenedores de los recursos necesarios para ejecutar tus aplicaciones, lo que hace que sean lentos y poco confiables. El aprovisionamiento excesivo no afecta el rendimiento de tus aplicaciones, pero puede aumentar la factura mensual.

En la siguiente tabla, se describen las implicaciones del aprovisionamiento insuficiente y excesivo de CPU y memoria:

Recurso	Estado de aprovisionamiento	Riesgo	Explicación
CPU	Más de	Costo	Aumenta el costo de las cargas de trabajo, ya que reserva recursos innecesarios.
	Bajo	Rendimiento	Puede hacer que las cargas de trabajo sean más lentas o dejen de responder.
	No se estableció	Confiabilidad	La CPU puede limitarse a 0, lo que hará que las cargas de trabajo no respondan.
Memoria	Más de	Costo	Aumenta el costo de las cargas de trabajo, ya que reserva recursos innecesarios.
	Bajo	Confiabilidad	Puede hacer que las aplicaciones finalicen con un error de memoria insuficiente (OOM).
	No se estableció	Confiabilidad	`kubelet` puede detener tus Pods en cualquier momento y marcarlos como con errores.

Objetivos

En este instructivo aprenderás realizar las siguientes tareas:

Implementar una aplicación de muestra
Exporta las métricas de recomendaciones de GKE de Monitoring a BigQuery.
Usa BigQuery y Data Studio para ver las recomendaciones para contenedores de GKE en todos los proyectos

Costos

En este documento, usarás los siguientes componentes facturables de Google Cloud:

Para generar una estimación de costos en función del uso previsto, usa la calculadora de precios.

Es posible que los usuarios de Google Cloud nuevos cumplan con los requisitos para acceder a una prueba gratuita.

Cuando completes las tareas que se describen en este documento, podrás borrar los recursos que creaste para evitar que se te siga facturando. Para obtener más información, consulta Realiza una limpieza.

Antes de comenzar

Configura tu proyecto

Cloud Shell está preinstalado con el software que necesitas para este instructivo, incluido lo siguiente: Docker, kubectl, gcloud CLI y Terraform. Si no usas Cloud Shell, debes instalar gcloud CLI.

Accede a tu cuenta de Google Cloud . Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.

Instala Google Cloud CLI.

Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.

Para inicializar gcloud CLI, ejecuta el siguiente comando:

gcloud init

Crea o selecciona un Google Cloud proyecto.

Roles necesarios para seleccionar o crear un proyecto

Selecciona un proyecto: Para seleccionar un proyecto, no se requiere un rol de IAM específico. Puedes seleccionar cualquier proyecto en el que se te haya otorgado un rol.
Crear un proyecto: Para crear un proyecto, necesitas el rol de Creador de proyectos (roles/resourcemanager.projectCreator), que contiene el permiso resourcemanager.projects.create. Obtén más información para otorgar roles.

Crea un Google Cloud proyecto:
```
gcloud projects create PROJECT_ID
```
Reemplaza PROJECT_ID por un nombre para el proyecto Google Cloud que estás creando.
Selecciona el proyecto Google Cloud que creaste:
```
gcloud config set project PROJECT_ID
```
Reemplaza PROJECT_ID por el nombre de tu Google Cloud proyecto.

Verifica que la facturación esté habilitada para tu proyecto de Google Cloud .

Habilita las APIs de Resource Manager, Google Kubernetes Engine, Cloud Monitoring, BigQuery, Cloud Run y Cloud Build:

Roles necesarios para habilitar las APIs

Para habilitar las APIs, necesitas el rol de IAM de administrador de Service Usage (roles/serviceusage.serviceUsageAdmin), que contiene el permiso serviceusage.services.enable. Obtén más información para otorgar roles.

gcloud services enable cloudresourcemanager.googleapis.com container.googleapis.com monitoring.googleapis.com bigquery.googleapis.com run.googleapis.com cloudbuild.googleapis.com cloudscheduler.googleapis.com artifactregistry.googleapis.com

Instala Google Cloud CLI.

Si usas un proveedor de identidad externo (IdP), primero debes acceder a la gcloud CLI con tu identidad federada.

Para inicializar gcloud CLI, ejecuta el siguiente comando:

gcloud init

Crea o selecciona un Google Cloud proyecto.

Roles necesarios para seleccionar o crear un proyecto

Selecciona un proyecto: Para seleccionar un proyecto, no se requiere un rol de IAM específico. Puedes seleccionar cualquier proyecto en el que se te haya otorgado un rol.
Crear un proyecto: Para crear un proyecto, necesitas el rol de Creador de proyectos (roles/resourcemanager.projectCreator), que contiene el permiso resourcemanager.projects.create. Obtén más información para otorgar roles.

Crea un Google Cloud proyecto:
```
gcloud projects create PROJECT_ID
```
Reemplaza PROJECT_ID por un nombre para el proyecto Google Cloud que estás creando.
Selecciona el proyecto Google Cloud que creaste:
```
gcloud config set project PROJECT_ID
```
Reemplaza PROJECT_ID por el nombre de tu Google Cloud proyecto.

Verifica que la facturación esté habilitada para tu proyecto de Google Cloud .

Habilita las APIs de Resource Manager, Google Kubernetes Engine, Cloud Monitoring, BigQuery, Cloud Run y Cloud Build:

Roles necesarios para habilitar las APIs

gcloud services enable cloudresourcemanager.googleapis.com container.googleapis.com monitoring.googleapis.com bigquery.googleapis.com run.googleapis.com cloudbuild.googleapis.com cloudscheduler.googleapis.com artifactregistry.googleapis.com

Otorga roles a tu cuenta de usuario. Ejecuta el siguiente comando una vez para cada uno de los siguientes roles de IAM: roles/serviceusage.serviceUsageAdmin, roles/container.clusterAdmin, roles/iam.serviceAccountAdmin, roles/iam.securityAdmin, roles/container.admin
```
gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
```
Reemplaza lo siguiente:
- PROJECT_ID: ID del proyecto
- USER_IDENTIFIER: Es el identificador de tu cuenta de usuario de . Por ejemplo, myemail@example.com.
- ROLE: Es el rol de IAM que otorgas a tu cuenta de usuario.

Configura tu entorno

Para configurar tu entorno, sigue estos pasos

Establece las variables de entorno:

export PROJECT_ID=PROJECT_ID
export REGION=us-central1
export ZONE=us-central1-f
export IMAGE=$REGION-docker.pkg.dev/$PROJECT_ID/main/vpa-recs-image:latest

Reemplaza PROJECT_ID por el ID del proyecto de Google Cloud.

Configura las variables de entorno predeterminadas:

gcloud config set project $PROJECT_ID
gcloud config set compute/region $REGION
gcloud config set compute/zone $ZONE

Clona el repositorio de código.

git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples

Cambia al directorio de trabajo.

cd kubernetes-engine-samples/cost-optimization/gke-vpa-recommendations

Configura la aplicación de ejemplo (opcional)

Esta es una sección opcional para implementar una aplicación de ejemplo. Para usar un clúster existente, asegúrate de que Cloud Monitoring esté configurado en tu clúster.

Para simular un entorno realista, usarás una secuencia de comandos de configuración para implementar Online Boutique.

En los siguientes pasos, se instala la aplicación de muestra y se modifica la configuración predeterminada. Por ejemplo, en las instrucciones se configura Horizontal Pod Autoscaler (HPA) para algunas cargas de trabajo y se cambian los requisitos y límites de recursos.

Ejecuta la secuencia de comandos de configuración:
```
./scripts/setup.sh
```
La secuencia de comandos de configuración hace lo siguiente:
- Crea un clúster de GKE.
- Implementa la aplicación de muestra Online Boutique.
- Actualiza las solicitudes de recursos de CPU y memoria del Pod.
- Configura un recurso HorizontalPodAutoscaler para las cargas de trabajo adservice para simular un entorno realista.
La secuencia de comandos de configuración puede tardar hasta 10 minutos en completarse.

Verifica que la aplicación de muestra esté lista:

kubectl get deployment

El resultado es similar a este:

NAME                    READY   UP-TO-DATE   AVAILABLE   AGE
adservice               2/2     2            2           4m54s
cartservice             1/1     1            1           4m55s
checkoutservice         1/1     1            1           4m56s
currencyservice         1/1     1            1           4m55s
emailservice            1/1     1            1           4m56s
frontend                1/1     1            1           4m55s
loadgenerator           1/1     1            1           4m55s
paymentservice          1/1     1            1           4m55s
productcatalogservice   1/1     1            1           4m55s
recommendationservice   1/1     1            1           4m56s
redis-cart              1/1     1            1           4m54s
shippingservice         1/1     1            1           4m54s

Crear un repositorio

Crea el repositorio para almacenar la imagen del exportador de métricas.

Crea un repositorio de Docker nuevo:

gcloud artifacts repositories create main --repository-format=docker \
    --location=$REGION \
    --description="docker repository"

Configura la autenticación en los repositorios de Docker:
```
gcloud auth configure-docker $REGION-docker.pkg.dev
```

Para implementar la imagen, ejecuta el siguiente comando:

gcloud builds submit metrics-exporter --region=$REGION --tag $IMAGE

Implemente la aplicación

En la siguiente sección, usarás Terraform para realizar las siguientes tareas:

Crea una cuenta de servicio y asígnale los permisos necesarios para administrar los recursos de Google Cloud y, también, interactuar con ellos.
Otorgar el visualizador de supervisión, el editor de datos de BigQuery, el propietario de los datos de BigQuery, el usuario del trabajo de BigQuery y los roles de invocador de Cloud Run a la cuenta de servicio.
Implementar un trabajo de Cloud Run que extraiga una imagen de Docker de Artifact Registry y la ejecute con la configuración especificada.
Crea un trabajo de Cloud Scheduler que active el servicio de Cloud Run a diario.
Crear un conjunto de datos, una tabla y una vista de BigQuery para almacenar datos y recomendaciones de métricas.

Configura Terraform

Establece las variables de entorno de configuración:
```
export TF_VAR_BIGQUERY_DATASET=gke_metrics_dataset
export TF_VAR_BIGQUERY_TABLE=gke_metrics
export TF_VAR_RECOMMENDATION_WINDOW_SECONDS=1209600
export TF_VAR_RECOMMENDATION_DISTANCE=86400
export TF_VAR_LATEST_WINDOW_SECONDS=600
export TF_VAR_METRIC_WINDOW=259200
export TF_VAR_METRIC_DISTANCE=600
```
Este comando incluye lo siguiente:
- TF_VAR_BIGQUERY_DATASET y TF_VAR_BIGQUERY_TABLE: Contienen los datos de las métricas de GKE.
- TF_VAR_RECOMMENDATION_WINDOW_SECONDS: Es el período para las recomendaciones de VPA. La configuración predeterminada es 1,209,600 segundos o 14 días.
- TF_VAR_RECOMMENDATION_DISTANCE: el intervalo en el que se muestran los datos de recomendación de la VPA. La configuración predeterminada es de 86,400 segundos o cada 1 día.
- TF_VAR_LATEST_WINDOW_SECONDS: Es el período para obtener los valores de recursos solicitados y de límite más recientes. La configuración predeterminada es de 600 segundos o 10 minutos.
- METRIC_WINDOW: establece el período para las métricas de uso y utilización de GKE. La configuración predeterminada es 25,9200 segundos o 3 días.
- METRIC_DISTANCE: El intervalo en el que se muestran los datos. La configuración predeterminada es de 600 segundos o cada 10 minutos.
Ajusta estos valores según las necesidades de tus cargas de trabajo. Por ejemplo, para las cargas de trabajo por lotes que se ejecutan una vez al mes, actualiza TF_VAR_RECOMMENDATION_WINDOW_SECONDS y METRIC_WINDOW a 2592000 segundos (30 días).

Implementa la configuración de Terraform

Inicializa, valida y aplica tu configuración:
```
terraform -chdir=terraform init
terraform -chdir=terraform validate
terraform -chdir=terraform apply -var project_id=$PROJECT_ID -var region=$REGION -var image=$IMAGE
```
Este comando proporciona un plan de ejecución y te pide que lo apruebes antes de realizar cualquier cambio. Revisa el plan y, si todo está como se espera, escribe yes para continuar.

Una vez que el comando apply se completa correctamente, Terraform crea y administra tus recursos.

Ejecuta el trabajo de Cloud Scheduler de forma manual:

gcloud scheduler jobs run recommendation-schedule --location ${REGION}

Verifica la implementación

Selecciona la pestaña Registros en la página de detalles de workload-recommendations.
Verifica que los registros de métricas se procesen en la consola de Cloud Run:

Ir a Cloud Run

Los registros muestran las métricas que se escriben en BigQuery. El resultado debería ser similar al siguiente ejemplo:
```
INFO - Building Row
INFO - Successfully wrote 12 rows to BigQuery table [PROJECT_ID].gke_metric_dataset.gke_metrics.
INFO - Run Completed
```
Si el resultado no coincide, espera cinco minutos y, luego, ejecuta el comando gcloud scheduler jobs run recommendation-schedule --location $REGION.

Visualiza la recomendación para contenedores en BigQuery

Ve a la página de BigQuery en la consola de Google Cloud :

Ir a BigQuery
Verifica que los datos sean visibles en la tabla gke_metrics y en la vista container_recommendations. Según la cantidad de cargas de trabajo, la escritura de todas las métricas en BigQuery puede tardar unos minutos.
En el editor de consultas, selecciona todas las filas de la vista container_recommendations:
```
SELECT * FROM `PROJECT_ID.gke_metrics_dataset.container_recommendations`
```
Este programa extrae las siguientes métricas de la supervisión de Cloud:
- Detalles de la carga de trabajo: el ID del proyecto, el nombre del clúster, el controlador y el nombre del contenedor
- Uso y utilización de CPU/memoria: la cantidad de CPU y memoria que usa la carga de trabajo, así como el porcentaje de CPU y memoria que consume.
- Solicitada y límites: la cantidad de CPU y memoria que se solicitó para la carga de trabajo, así como la cantidad máxima de CPU y memoria permitida para la carga de trabajo.
- Recomendaciones de CPU y memoria: Recomendaciones sobre cuánta CPU y memoria se deben asignar a la carga de trabajo para garantizar que se ejecute sin problemas, según las recomendaciones de VPA para las implementaciones y en el uso real. usos objetivo para objetos que no sean Deployment.

Visualiza recomendaciones en Data Studio

Data Studio es una plataforma de inteligencia empresarial gratuita y de autoservicio que te permite compilar y consumir informes, paneles y visualizaciones de datos. Con Data Studio, puedes conectarte a tus datos, crear visualizaciones y compartir tus estadísticas con otras personas.

Usa Data Studio para visualizar datos en la vista container_recommendations de BigQuery:

Abre la plantilla del panel de ajuste de tamaño de la carga de trabajo.
Haz clic en Usar mis propios datos.
Selecciona tu proyecto.
En Conjunto de datos, selecciona gke_metric_dataset.
En Tabla, selecciona container_recommendations.
Haz clic en Agregar.
Haz clic en Agregar al informe.

Detalles de la plantilla de Data Studio

La página de detalles de la plantilla de Data Studio proporciona la siguiente información:

Descripción general del ajuste del tamaño de las cargas de trabajo de GKE: Proporciona una descripción general de tus clústeres, incluidos los siguientes elementos:
- Es la cantidad de cargas de trabajo de mejor esfuerzo y con capacidad de ráfaga que corren riesgo de tener problemas de confiabilidad y rendimiento.
- Ahorro potencial de recursos de CPU y memoria Los valores positivos indican un exceso de aprovisionamiento, mientras que los valores negativos indican un aprovisionamiento insuficiente.
Recomendaciones de cargas de trabajo: proporciona recomendaciones para las solicitudes y los límites de CPU y memoria de la carga de trabajo.
Cargas de trabajo de GKE en riesgo: Muestra las cargas de trabajo que corren el mayor riesgo de experimentar problemas de confiabilidad y rendimiento.
Historial: Ajuste del tamaño de la carga de trabajo: ¿Qué tal lo estamos haciendo?: Proporciona una vista histórica de lo bien que se implementó el ajuste del tamaño de la carga de trabajo y la reducción de la cantidad de cargas de trabajo de mejor esfuerzo.

Recomendación del contenedor sobre CPU solicitada y límite

Si los valores del límite y la CPU solicitada de las cargas de trabajo son iguales, el QoS se considera Garantizado y la recomendación de CPU se establece como el máximo dentro del período de período de 14 días. De lo contrario, se usa el percentil 95 de la recomendación de CPU en un plazo de 14 días.

Cuando los valores de CPU solicitada y límite son iguales, la recomendación para el límite de CPU se establece en la recomendación máxima de CPU solicitada del VPA solo para objetos de Deployment y el uso de CPU con una utilización objetivo del 70%. Si la solicitud y el límite de la carga de trabajo no son idénticos, se usa la proporción de límite existente.

Recomendación del contenedor sobre memoria solicitada y límite

Las recomendaciones de memoria usan la recomendación máxima del VPA solo para objetos de implementaciones y el uso máximo de memoria con una utilización objetivo del 80% para garantizar la confiabilidad de las cargas de trabajo. Puedes actualizar los valores de utilización objetivo en la consulta de la vista container_recommendation.

Se recomienda usar la misma cantidad de memoria para las solicitudes y los límites, ya que la memoria es un recurso que no se puede comprimir. Cuando se agota la memoria, se debe quitar el Pod. Para evitar que se quiten los Pods y, en consecuencia, se desestabilice tu entorno, debes configurar la memoria solicitada como el límite de memoria.

Prioriza las recomendaciones

Se asigna un valor de prioridad a cada fila para mostrar las cargas de trabajo que requieren atención inmediata según las recomendaciones del VPA. Las unidades de CPU y memoria son diferentes. Para normalizar las unidades, se usa la proporción de precio según demanda del tipo de máquina E2 entre la memoria y la CPU predefinidas como una aproximación para convertir unidades de memoria en unidades de CPU.

La prioridad se calcula con la siguiente fórmula:

priority = (CPU requested - CPU recommendation) + ((memory requested -
memory recommendation) / (vCPUs on-demand pricing /memory on-demand pricing ))

Para Autopilot, el total de recursos que solicita tu configuración de implementación debe estar dentro de los valores mínimos y máximos admitidos.

Visualiza las recomendaciones del VPA para varios proyectos

Para ver recomendaciones sobre contenedores del VPA en varios proyectos, usa un proyecto nuevo como proyecto de permisos.

Cuando implementes este proyecto en el entorno de producción, agrega todos los proyectos que desees analizar al permiso de las métricas del proyecto nuevo.

Libera espacio

Para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos usados en este instructivo, borra el proyecto que contiene los recursos o conserva el proyecto y borra los recursos individuales.

Borra el proyecto

La manera más fácil de evitar la facturación es borrar el proyecto que creaste para el instructivo.

Precaución: Borrar un proyecto tiene las siguientes consecuencias:

Se borra todo su contenido. Si usaste un proyecto existente para las tareas de este documento, cuando lo borres, también se borrará cualquier otro trabajo que hayas realizado en el proyecto.
Se pierden los IDs personalizados de los proyectos. Cuando creaste este proyecto, es posible que hayas creado un ID personalizado del proyecto que desees utilizar en el futuro. Para conservar las URLs que usan el ID del proyecto, como una URL appspot.com, borra los recursos seleccionados dentro del proyecto, en lugar de todo el proyecto.

Si planeas explorar varios instructivos, arquitecturas o guías de inicio rápido, reutilizar proyectos puede ser útil para no exceder los límites de cuota de los proyectos.

Borra un Google Cloud proyecto:

gcloud projects delete PROJECT_ID

¿Qué sigue?

Obtén más información sobre la optimización de costos en GKE en Prácticas recomendadas para la ejecución de aplicaciones de Kubernetes con optimización de costos en GKE.
Encuentra recomendaciones de diseño y prácticas recomendadas para optimizar el costo de las cargas de trabajo de Google Cloud en el Google Cloud Framework de Well-Architected: Optimización de costos.
Obtén más información sobre la optimización de costos de tu clúster durante los períodos de baja demanda en Reduce los costos mediante la reducción vertical de la escala de clústeres de GKE durante las horas de menor demanda.
Obtén más información sobre la optimización de costos de GKE en Supervisa los clústeres de GKE para optimizar costos con Monitoring.

Redimensiona tus cargas de trabajo de GKE a gran escala Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Comprende por qué es importante el redimensionamiento de los recursos

Objetivos

Costos

Antes de comenzar

Configura tu proyecto

Configura tu entorno

Configura la aplicación de ejemplo (opcional)

Crear un repositorio

Implemente la aplicación

Configura Terraform

Implementa la configuración de Terraform

Verifica la implementación

Visualiza la recomendación para contenedores en BigQuery

Visualiza recomendaciones en Data Studio

Detalles de la plantilla de Data Studio

Recomendación del contenedor sobre CPU solicitada y límite

Recomendación del contenedor sobre memoria solicitada y límite

Prioriza las recomendaciones

Visualiza las recomendaciones del VPA para varios proyectos

Libera espacio

Borra el proyecto

¿Qué sigue?

Redimensiona tus cargas de trabajo de GKE a gran escala