Acerca de las cargas de trabajo del modo Autopilot en GKE Standard

Puedes usar ComputeClasses para ejecutar cargas de trabajo de Autopilot de Google Kubernetes Engine (GKE) en tus clústeres de modo Standard de GKE. En este documento, se describen los métodos que puedes usar para ejecutar tus cargas de trabajo en modo Autopilot y te ayuda a decidir cuándo ejecutar una carga de trabajo en un modo específico.

Esta información está destinada a las siguientes personas:

  • Arquitectos de la nube que desean optimizar los costos operativos en las organizaciones
  • Administradores de plataformas que desean reducir la sobrecarga de la administración manual de la infraestructura
  • Ingenieros de confiabilidad de sitios (SRE) que desean cambiar el mantenimiento, las actualizaciones y el escalamiento de la infraestructura a Google Cloud cuando sea posible.

Ya debes estar familiarizado con los siguientes conceptos:

Acerca de GKE Autopilot

Autopilot es un modo de operación en GKE en el que Google administra tu infraestructura de nodos, escalamiento, seguridad y funciones preconfiguradas. El modo Autopilot está optimizado para ejecutar la mayoría de las cargas de trabajo de producción en un entorno que aplica la configuración recomendada para la seguridad, la confiabilidad, el rendimiento y la escalabilidad. Para decidir entre el modo Autopilot y el modo Standard según tus requisitos, consulta Acerca de los modos de operación de GKE.

Puedes usar el modo Autopilot de las siguientes maneras:

  • Crea un clúster que use el modo Autopilot: Google administra todo el clúster y aplica prácticas recomendadas para la automatización, la confiabilidad, la seguridad y los costos.
  • Ejecuta cargas de trabajo en modo Autopilot en clústeres Standard: Implementas ComputeClasses de Autopilot y las seleccionas en las cargas de trabajo. Google administra los nodos que GKE crea para esas cargas de trabajo específicas en un grupo de nodos administrado por Autopilot pool. Tú controlas el clúster y puedes ejecutar tus propios grupos de nodos Standard junto con los nodos que administra GKE.

Acerca del modo Autopilot para ComputeClasses

Una ComputeClass es un recurso personalizado de Kubernetes que define una lista de configuraciones de nodos, como tipos de máquinas o parámetros de configuración de funciones. Puedes seleccionar ComputeClasses específicas en las especificaciones de carga de trabajo de Kubernetes. Cuando una carga de trabajo que selecciona una ComputeClass necesita un nodo nuevo, GKE intenta aprovisionar el nodo con una de las configuraciones que declara la ComputeClass. GKE prueba cada configuración en la ComputeClass en orden y vuelve a la siguiente configuración si falla la creación del nodo. Para obtener más información, consulta Acerca de las ComputeClasses personalizadas.

Para ejecutar cargas de trabajo de Autopilot en tus clústeres de GKE Standard, habilita el modo Autopilot en una ComputeClass y selecciona esa ComputeClass en cargas de trabajo específicas. Google administra cualquier nodo nuevo que GKE aprovisione para estas cargas de trabajo, de manera similar a como Google administra los nodos en los clústeres de Autopilot. La mayoría de los beneficios y las funciones de seguridad del modo Autopilot se aplican a esas cargas de trabajo y a los nodos host.

Las ComputeClasses del modo Autopilot proporcionan a los administradores de clústeres flexibilidad adicional para elegir el nivel de control que deseas sobre cargas de trabajo e infraestructura específicas en tu clúster, como de las siguientes maneras:

Estas opciones permiten a los administradores de clústeres decidir el nivel y el alcance con los que usan Autopilot.

Beneficios de las ComputeClasses de Autopilot en clústeres Standard

Ejecutar algunas de tus cargas de trabajo en modo Autopilot proporciona beneficios como los siguientes:

  • Reduce los costos de administración de la infraestructura: Google actualiza, mantiene, configura y ajusta nodos específicos por ti.
  • Usa el modelo de precios de Autopilot: Las cargas de trabajo que usan una ComputeClass de Autopilot se facturan con el modelo de precios de Autopilot. Este modelo de precios incluye la facturación por Pod para las cargas de trabajo que no solicitan hardware específico. Para obtener más información, consulta la sección Precios.
  • Mejora el escalamiento y la postura de seguridad: Las cargas de trabajo de Autopilot obtienen beneficios como el acceso a la plataforma de procesamiento optimizada para contenedores, restricciones de seguridad predeterminadas mejoradas y ajuste de escala automático de nodos basado en solicitudes de recursos. Los nodos para esas cargas de trabajo usan funciones como las actualizaciones automáticas de nodos y las reparaciones automáticas.
  • Mejora la confiabilidad: El Acuerdo de Nivel de Servicio (ANS) de GKE incluye un objetivo de nivel de servicio (SLO) de tiempo de actividad de Pod para Autopilot.

Muchos de estos beneficios también los proporcionan los clústeres de Autopilot, que también brindan una experiencia más administrada que los clústeres de Standard y que incluyen múltiples beneficios de seguridad, redes y administración de recursos. Para obtener más información, consulta Descripción general de Autopilot.

Selección de hardware en ComputeClasses de Autopilot

En las ComputeClasses de Autopilot, puedes seleccionar hardware específico para tus nodos (como GPUs o tipos de máquinas) o permitir que GKE coloque Pods en una plataforma de procesamiento de uso general optimizada para contenedores. Se recomienda la opción de uso general para la mayoría de las cargas de trabajo de producción que no requieren hardware específico para ejecutarse bien. Admite arquitecturas x86 y Arm.

En la siguiente tabla, se describen estas opciones de configuración, cómo elegir una en una ComputeClass y cómo esta elección afecta tu modelo de facturación:

Tabla 1. Selección de hardware en ComputeClasses de Autopilot
Requisito de la carga de trabajo Configuración recomendada de ComputeClass Modelo de facturación
Cargas de trabajo de uso general

Usa una ComputeClass de Autopilot que tenga la podFamily regla de prioridad para ejecutar cargas de trabajo que no requieren hardware específico en la plataforma de procesamiento optimizada para contenedores de Autopilot. Esta plataforma funciona bien para cargas de trabajo de uso general como las siguientes:

  • Servidores web
  • Trabajos controlados por eventos
  • Procesamiento por lotes
  • Canalizaciones de CI/CD

Las ComputeClasses integradas de Autopilot solo usan reglas de prioridad podFamily. También puedes agregar podFamily reglas de prioridad a las ComputeClasses personalizadas de Autopilot.

Modelo de facturación basado en Pods
Cargas de trabajo que necesitan hardware específico

Usa una ComputeClass que use cualquier regla de configuración de hardware disponible, como la regla machineFamily o la regla gpus.

Modelo de facturación basado en nodos

Configuración de Autopilot en ComputeClasses

Puedes usar el modo Autopilot en un clúster Standard con una ComputeClass integrada de Autopilot que proporciona GKE o habilitando Autopilot en cualquier ComputeClass personalizada que crees. En las siguientes secciones, se describe cada opción.

ComputeClasses integradas de Autopilot

GKE configura ComputeClasses específicas de Autopilot por ti. Puedes seleccionar estas clases integradas de Autopilot en cualquier clúster apto. Las ComputeClasses integradas de Autopilot en clústeres Standard usan la regla de prioridad podFamily para ejecutar Pods en la plataforma de procesamiento optimizada para contenedores. Para obtener más información, consulta Acerca de las ComputeClasses integradas en GKE.

ComputeClasses personalizadas de Autopilot

Puedes habilitar Autopilot en cualquier ComputeClass personalizada que administres con el campo autopilot en la especificación de ComputeClass. Las ComputeClasses personalizadas de Autopilot son útiles en situaciones como las siguientes:

  • Tus cargas de trabajo tienen requisitos de hardware específicos, como aceleradores.
  • Deseas modificar ciertas opciones de nodos, como configurar zonas o aplicar taints, mientras usas la plataforma de procesamiento optimizada para contenedores de Autopilot.

Para habilitar Autopilot en una ComputeClass existente, debes borrarla, actualizar la configuración y, luego, volver a crear la ComputeClass en tu clúster. Los cambios se aplican a cualquier nodo nuevo que GKE cree para las cargas de trabajo que implementes después de actualizar la ComputeClass de Autopilot.

Para obtener más información sobre cómo habilitar Autopilot en tus ComputeClasses personalizadas, consulta Selecciona hardware específico para tus Pods de Autopilot.

Precios

Los precios de GKE Autopilot se aplican a los nodos y las cargas de trabajo que GKE crea para una ComputeClass de Autopilot. El modelo de facturación de Autopilot que se aplica a una carga de trabajo específica depende de la regla de prioridad de ComputeClass que usa GKE para crear nodos para esa carga de trabajo.

En la siguiente tabla, se describe el modelo de facturación que se aplica a diferentes configuraciones de ComputeClass de Autopilot en tus clústeres de modo Standard:

Tabla 2. Precios de las ComputeClasses de Autopilot
Modelos de facturación para diferentes configuraciones de ComputeClass
Modelo de facturación basado en Pods El modelo de facturación basado en Pods se aplica cuando GKE usa una podFamily regla de prioridad para crear nodos para una carga de trabajo. Las ComputeClasses integradas de Autopilot, siempre usan el modelo de facturación basado en Pods.
Modelo de facturación basado en nodos El modelo de facturación basado en nodos se aplica cuando GKE usa una regla de prioridad de ComputeClass que solicita explícitamente hardware específico, como una determinada familia de máquinas o GPUs.

Los precios de Autopilot solo se aplican a las cargas de trabajo y los nodos que usan una ComputeClass de Autopilot. Tu clúster de modo Standard y cualquier otro grupo de nodos que ejecutes seguirán usando los precios del modo Standard de GKE.

Parámetros de configuración predefinidos para nodos administrados por Autopilot

Antes de habilitar el modo Autopilot en tus ComputeClasses, debes saber qué esperar de los nodos que GKE crea para ejecutar las cargas de trabajo de Autopilot. Google configura funciones y restricciones de seguridad específicas en los nodos de Autopilot. Como resultado, el modo Autopilot puede rechazar las cargas de trabajo que se implementan y funcionan correctamente en tus nodos de modo Standard si no cumplen con los requisitos de seguridad de Autopilot.

En la siguiente tabla, se describen las configuraciones de funciones que anulan la configuración correspondiente en tu clúster Standard. Si una configuración no está en esta tabla, los nodos de Autopilot usan la configuración del clúster Standard. Por ejemplo, Workload Identity Federation for GKE no está en esta tabla, lo que significa que el parámetro de configuración de Workload Identity Federation for GKE del clúster Standard se aplica a los nodos de Autopilot que crea GKE.

Tabla 3. Parámetros de configuración predefinidos para nodos de Autopilot
Función Parámetro de configuración a nivel de clúster Standard Parámetro de configuración de nodos administrados por Autopilot
Actualizaciones y mantenimiento de los nodos

Configurable:

Preconfigurado:

  • Reparación automática de nodos: habilitada
  • Actualización automática de nodos: habilitada
  • Estrategia de actualización de nodos: actualizaciones de aumento con parámetros preconfigurados
Ajuste de escala automático Configurable: Perfil de ajuste de escala automático Preconfigurado: Perfil de ajuste de escala automático optimize-utilization
Redes Nativo de la VPC o basado en rutas Requiere un clúster nativo de la VPC
Seguridad

Configurable:

  • Cuenta de servicio de IAM de nodos
  • Permisos de acceso
  • Inicio seguro

Preconfigurado:

Sistema operativo del nodo

Configurable:

Preconfigurado:

Disco de arranque del nodo

Configurable:

Configurable:

Metadatos del nodo

Solicitudes de recursos para cargas de trabajo de Autopilot

Para que las cargas de trabajo de Autopilot se ejecuten de manera eficiente, GKE aplica ciertos valores mínimos y máximos para las solicitudes de CPU, memoria y almacenamiento efímero en tus Pods. GKE también aplica solicitudes predeterminadas a los Pods que no solicitan explícitamente uno de estos recursos. Los valores específicos para los requisitos de recursos mínimos, máximos y predeterminados en las cargas de trabajo de GKE Autopilot varían según el tipo de hardware que usan tus Pods.

Para el almacenamiento efímero, el valor predeterminado si no solicitas almacenamiento efímero es el mismo para todas las ComputeClasses y selecciones de hardware. Para obtener más información, consulta Solicitudes de recursos predeterminadas.

En la siguiente tabla, se proporcionan vínculos a los requisitos de CPU y memoria para tus solicitudes de Pod, según el tipo de hardware:

Tabla 4. Requisitos de CPU y memoria de Autopilot
Tipo de recurso Solicitudes mínimas y máximas Solicitudes predeterminadas
Pods de uso general
GPUs y TPUs Depende del tipo y la cantidad de acelerador de hardware. Para obtener más información, consulta Mínimos y máximos para la ComputeClass de Accelerator. Depende del tipo y la cantidad de acelerador de hardware. Para obtener más información, consulta Solicitudes predeterminadas para aceleradores.
Tipos de máquinas y familias de máquinas específicos de Compute Engine
  • Mínimo: No hay valores mínimos para la CPU ni la memoria.
  • Máximo: El valor máximo es la capacidad de recursos de la instancia de Compute Engine.
Para cualquier tipo de máquina o familia de máquinas de Compute Engine, las solicitudes predeterminadas en la fila "De uso general" en la tabla Solicitudes predeterminadas para ComputeClasses.

¿Qué sigue?