Puedes usar ComputeClasses para ejecutar cargas de trabajo de Autopilot de Google Kubernetes Engine (GKE) en tus clústeres de modo Standard de GKE. En este documento, se describen los métodos que puedes usar para ejecutar tus cargas de trabajo en modo Autopilot y te ayuda a decidir cuándo ejecutar una carga de trabajo en un modo específico.
Esta información está destinada a las siguientes personas:
- Arquitectos de la nube que desean optimizar los costos operativos en las organizaciones
- Administradores de plataformas que desean reducir la sobrecarga de la administración manual de la infraestructura
- Ingenieros de confiabilidad de sitios (SRE) que desean cambiar el mantenimiento, las actualizaciones y el escalamiento de la infraestructura a Google Cloud cuando sea posible.
Ya debes estar familiarizado con los siguientes conceptos:
Acerca de GKE Autopilot
Autopilot es un modo de operación en GKE en el que Google administra tu infraestructura de nodos, escalamiento, seguridad y funciones preconfiguradas. El modo Autopilot está optimizado para ejecutar la mayoría de las cargas de trabajo de producción en un entorno que aplica la configuración recomendada para la seguridad, la confiabilidad, el rendimiento y la escalabilidad. Para decidir entre el modo Autopilot y el modo Standard según tus requisitos, consulta Acerca de los modos de operación de GKE.
Puedes usar el modo Autopilot de las siguientes maneras:
- Crea un clúster que use el modo Autopilot: Google administra todo el clúster y aplica prácticas recomendadas para la automatización, la confiabilidad, la seguridad y los costos.
- Ejecuta cargas de trabajo en modo Autopilot en clústeres Standard: Implementas ComputeClasses de Autopilot y las seleccionas en las cargas de trabajo. Google administra los nodos que GKE crea para esas cargas de trabajo específicas en un grupo de nodos administrado por Autopilot pool. Tú controlas el clúster y puedes ejecutar tus propios grupos de nodos Standard junto con los nodos que administra GKE.
Acerca del modo Autopilot para ComputeClasses
Una ComputeClass es un recurso personalizado de Kubernetes que define una lista de configuraciones de nodos, como tipos de máquinas o parámetros de configuración de funciones. Puedes seleccionar ComputeClasses específicas en las especificaciones de carga de trabajo de Kubernetes. Cuando una carga de trabajo que selecciona una ComputeClass necesita un nodo nuevo, GKE intenta aprovisionar el nodo con una de las configuraciones que declara la ComputeClass. GKE prueba cada configuración en la ComputeClass en orden y vuelve a la siguiente configuración si falla la creación del nodo. Para obtener más información, consulta Acerca de las ComputeClasses personalizadas.
Para ejecutar cargas de trabajo de Autopilot en tus clústeres de GKE Standard, habilita el modo Autopilot en una ComputeClass y selecciona esa ComputeClass en cargas de trabajo específicas. Google administra cualquier nodo nuevo que GKE aprovisione para estas cargas de trabajo, de manera similar a como Google administra los nodos en los clústeres de Autopilot. La mayoría de los beneficios y las funciones de seguridad del modo Autopilot se aplican a esas cargas de trabajo y a los nodos host.
Las ComputeClasses del modo Autopilot proporcionan a los administradores de clústeres flexibilidad adicional para elegir el nivel de control que deseas sobre cargas de trabajo e infraestructura específicas en tu clúster, como de las siguientes maneras:
- Puedes permitir que GKE administre por completo cargas de trabajo específicas ejecutándolas en modo Autopilot.
- Conservas el control total sobre las cargas de trabajo y la infraestructura que no usan el modo Autopilot, como los grupos de nodos creados de forma manual.
- Puedes establecer una ComputeClass de Autopilot como predeterminada para tu clúster o espacio de nombres, de modo que las cargas de trabajo se ejecuten en modo Autopilot, a menos que soliciten explícitamente una opción diferente.
Estas opciones permiten a los administradores de clústeres decidir el nivel y el alcance con los que usan Autopilot.
Beneficios de las ComputeClasses de Autopilot en clústeres Standard
Ejecutar algunas de tus cargas de trabajo en modo Autopilot proporciona beneficios como los siguientes:
- Reduce los costos de administración de la infraestructura: Google actualiza, mantiene, configura y ajusta nodos específicos por ti.
- Usa el modelo de precios de Autopilot: Las cargas de trabajo que usan una ComputeClass de Autopilot se facturan con el modelo de precios de Autopilot. Este modelo de precios incluye la facturación por Pod para las cargas de trabajo que no solicitan hardware específico. Para obtener más información, consulta la sección Precios.
- Mejora el escalamiento y la postura de seguridad: Las cargas de trabajo de Autopilot obtienen beneficios como el acceso a la plataforma de procesamiento optimizada para contenedores, restricciones de seguridad predeterminadas mejoradas y ajuste de escala automático de nodos basado en solicitudes de recursos. Los nodos para esas cargas de trabajo usan funciones como las actualizaciones automáticas de nodos y las reparaciones automáticas.
- Mejora la confiabilidad: El Acuerdo de Nivel de Servicio (ANS) de GKE incluye un objetivo de nivel de servicio (SLO) de tiempo de actividad de Pod para Autopilot.
Muchos de estos beneficios también los proporcionan los clústeres de Autopilot, que también brindan una experiencia más administrada que los clústeres de Standard y que incluyen múltiples beneficios de seguridad, redes y administración de recursos. Para obtener más información, consulta Descripción general de Autopilot.
Selección de hardware en ComputeClasses de Autopilot
En las ComputeClasses de Autopilot, puedes seleccionar hardware específico para tus nodos (como GPUs o tipos de máquinas) o permitir que GKE coloque Pods en una plataforma de procesamiento de uso general optimizada para contenedores. Se recomienda la opción de uso general para la mayoría de las cargas de trabajo de producción que no requieren hardware específico para ejecutarse bien. Admite arquitecturas x86 y Arm.
En la siguiente tabla, se describen estas opciones de configuración, cómo elegir una en una ComputeClass y cómo esta elección afecta tu modelo de facturación:
| Requisito de la carga de trabajo | Configuración recomendada de ComputeClass | Modelo de facturación |
|---|---|---|
| Cargas de trabajo de uso general | Usa una ComputeClass de Autopilot que tenga la
Las
ComputeClasses integradas de Autopilot
solo usan reglas de prioridad |
Modelo de facturación basado en Pods |
| Cargas de trabajo que necesitan hardware específico | Usa una ComputeClass que use cualquier regla de configuración de hardware disponible, como la regla |
Modelo de facturación basado en nodos |
Configuración de Autopilot en ComputeClasses
Puedes usar el modo Autopilot en un clúster Standard con una ComputeClass integrada de Autopilot que proporciona GKE o habilitando Autopilot en cualquier ComputeClass personalizada que crees. En las siguientes secciones, se describe cada opción.
ComputeClasses integradas de Autopilot
GKE configura ComputeClasses específicas de Autopilot por ti. Puedes
seleccionar estas clases integradas de Autopilot
en cualquier clúster apto. Las ComputeClasses integradas de Autopilot en clústeres Standard usan la regla de prioridad podFamily para ejecutar Pods en la plataforma de procesamiento optimizada para contenedores. Para obtener más información, consulta
Acerca de las ComputeClasses integradas en GKE.
ComputeClasses personalizadas de Autopilot
Puedes habilitar Autopilot en cualquier ComputeClass personalizada que administres con el campo autopilot en la especificación de ComputeClass. Las ComputeClasses personalizadas de Autopilot son útiles en situaciones como las siguientes:
- Tus cargas de trabajo tienen requisitos de hardware específicos, como aceleradores.
- Deseas modificar ciertas opciones de nodos, como configurar zonas o aplicar taints, mientras usas la plataforma de procesamiento optimizada para contenedores de Autopilot.
Para habilitar Autopilot en una ComputeClass existente, debes borrarla, actualizar la configuración y, luego, volver a crear la ComputeClass en tu clúster. Los cambios se aplican a cualquier nodo nuevo que GKE cree para las cargas de trabajo que implementes después de actualizar la ComputeClass de Autopilot.
Para obtener más información sobre cómo habilitar Autopilot en tus ComputeClasses personalizadas, consulta Selecciona hardware específico para tus Pods de Autopilot.
Precios
Los precios de GKE Autopilot se aplican a los nodos y las cargas de trabajo que GKE crea para una ComputeClass de Autopilot. El modelo de facturación de Autopilot que se aplica a una carga de trabajo específica depende de la regla de prioridad de ComputeClass que usa GKE para crear nodos para esa carga de trabajo.
En la siguiente tabla, se describe el modelo de facturación que se aplica a diferentes configuraciones de ComputeClass de Autopilot en tus clústeres de modo Standard:
| Modelos de facturación para diferentes configuraciones de ComputeClass | |
|---|---|
| Modelo de facturación basado en Pods | El modelo de facturación basado en Pods se aplica cuando GKE usa una
podFamily regla de prioridad para crear nodos para una carga de trabajo. Las
ComputeClasses integradas de Autopilot,
siempre usan el modelo de facturación basado en Pods. |
| Modelo de facturación basado en nodos | El modelo de facturación basado en nodos se aplica cuando GKE usa una regla de prioridad de ComputeClass que solicita explícitamente hardware específico, como una determinada familia de máquinas o GPUs. |
Los precios de Autopilot solo se aplican a las cargas de trabajo y los nodos que usan una ComputeClass de Autopilot. Tu clúster de modo Standard y cualquier otro grupo de nodos que ejecutes seguirán usando los precios del modo Standard de GKE.
Parámetros de configuración predefinidos para nodos administrados por Autopilot
Antes de habilitar el modo Autopilot en tus ComputeClasses, debes saber qué esperar de los nodos que GKE crea para ejecutar las cargas de trabajo de Autopilot. Google configura funciones y restricciones de seguridad específicas en los nodos de Autopilot. Como resultado, el modo Autopilot puede rechazar las cargas de trabajo que se implementan y funcionan correctamente en tus nodos de modo Standard si no cumplen con los requisitos de seguridad de Autopilot.
En la siguiente tabla, se describen las configuraciones de funciones que anulan la configuración correspondiente en tu clúster Standard. Si una configuración no está en esta tabla, los nodos de Autopilot usan la configuración del clúster Standard. Por ejemplo, Workload Identity Federation for GKE no está en esta tabla, lo que significa que el parámetro de configuración de Workload Identity Federation for GKE del clúster Standard se aplica a los nodos de Autopilot que crea GKE.
| Función | Parámetro de configuración a nivel de clúster Standard | Parámetro de configuración de nodos administrados por Autopilot |
|---|---|---|
| Actualizaciones y mantenimiento de los nodos |
Configurable: |
Preconfigurado:
|
| Ajuste de escala automático | Configurable: Perfil de ajuste de escala automático | Preconfigurado: Perfil de ajuste de escala automático optimize-utilization |
| Redes | Nativo de la VPC o basado en rutas | Requiere un clúster nativo de la VPC |
| Seguridad |
Configurable:
|
Preconfigurado:
|
| Sistema operativo del nodo |
Configurable: |
Preconfigurado:
|
| Disco de arranque del nodo |
Configurable: |
Configurable:
|
| Metadatos del nodo |
|
|
Solicitudes de recursos para cargas de trabajo de Autopilot
Para que las cargas de trabajo de Autopilot se ejecuten de manera eficiente, GKE aplica ciertos valores mínimos y máximos para las solicitudes de CPU, memoria y almacenamiento efímero en tus Pods. GKE también aplica solicitudes predeterminadas a los Pods que no solicitan explícitamente uno de estos recursos. Los valores específicos para los requisitos de recursos mínimos, máximos y predeterminados en las cargas de trabajo de GKE Autopilot varían según el tipo de hardware que usan tus Pods.
Para el almacenamiento efímero, el valor predeterminado si no solicitas almacenamiento efímero es el mismo para todas las ComputeClasses y selecciones de hardware. Para obtener más información, consulta Solicitudes de recursos predeterminadas.
En la siguiente tabla, se proporcionan vínculos a los requisitos de CPU y memoria para tus solicitudes de Pod, según el tipo de hardware:
| Tipo de recurso | Solicitudes mínimas y máximas | Solicitudes predeterminadas |
|---|---|---|
| Pods de uso general |
|
|
| GPUs y TPUs | Depende del tipo y la cantidad de acelerador de hardware. Para obtener más información, consulta Mínimos y máximos para la ComputeClass de Accelerator. | Depende del tipo y la cantidad de acelerador de hardware. Para obtener más información, consulta Solicitudes predeterminadas para aceleradores. |
| Tipos de máquinas y familias de máquinas específicos de Compute Engine |
|
Para cualquier tipo de máquina o familia de máquinas de Compute Engine, las solicitudes predeterminadas en la fila "De uso general" en la tabla Solicitudes predeterminadas para ComputeClasses. |
¿Qué sigue?
- Implementa cargas de trabajo en modo Autopilot en clústeres Standard
- Acerca de las ComputeClasses personalizadas