Acerca del inicio más rápido de las cargas de trabajo con nodos de inicio rápido

En esta página se explica cómo desplegar y escalar cargas de trabajo más rápidamente en clústeres de Google Kubernetes Engine (GKE) mediante nodos de inicio rápido. Los nodos de inicio rápido se usan en GKE con el modo Autopilot de forma optimizada cuando las cargas de trabajo usan configuraciones compatibles.

Los nodos de GKE de inicio rápido tienen un tiempo de inicio significativamente menor para las familias de máquinas compatibles. El tiempo de inicio acelerado te ofrece las siguientes ventajas:

  • Arranque en frío más rápido
  • Autoescalado más rápido
  • Latencia de cola larga de la programación de pods mejorada
  • Mejora de la rentabilidad de la infraestructura

Con los nodos de inicio rápido, GKE preinicializa los recursos de hardware para acelerar el tiempo de inicio. Los recursos preinicializados están disponibles según el mejor esfuerzo posible. Es posible que las solicitudes de aumento solo se sirvan parcialmente. Sin nodos de inicio rápido, los recursos se inicializan bajo demanda y los nodos se sirven con el tiempo de inicio normal.

Requisitos

Los nodos de inicio rápido no requieren ninguna configuración adicional. GKE usa automáticamente nodos de inicio rápido si tus cargas de trabajo utilizan configuraciones compatibles. Para usar nodos de inicio rápido, debes cumplir todos los requisitos siguientes:

Limitaciones

Las siguientes funciones no son compatibles con los nodos de GKE de inicio rápido. Si usas alguna de estas funciones, GKE aprovisiona nodos con el tiempo de inicio habitual:

Cargas de trabajo de GPU de Autopilot

Si solicitas GPUs compatibles en el modo Autopilot, los nodos se iniciarán hasta cuatro veces más rápido y los pods se programarán hasta dos veces más rápido que si haces solicitudes similares en el modo Estándar de GKE, ya que las cargas de trabajo de GPU de Autopilot pueden usar nodos de inicio rápido.

A continuación, se muestran algunos ejemplos de casos prácticos. Sin embargo, los pods que cumplan las condiciones de la sección Requisitos son compatibles con los nodos de inicio rápido.

ComputeClass

Solicita un tipo y un número de acelerador compatibles en una ComputeClass, como en el siguiente ejemplo:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

Cuando seleccionas esta ComputeClass en un pod, como en el ejemplo siguiente, GKE usa nodos de inicio rápido:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: gcr.io/google_containers/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Sustituye los siguientes valores:

  • ACCELERATOR_COMPUTE_CLASS_NAME: nombre de la ComputeClass que solicita los aceleradores.
  • ACCELERATOR_TYPE: el tipo de acelerador.
  • ACCELERATOR_COUNT: número de aceleradores que necesita el pod. Este valor debe ser inferior o igual al valor del campo spec.priorities.gpu.count de ComputeClass.
  • POD_NAME: el nombre de tu Pod.

Para obtener más información sobre ComputeClass, consulta el artículo Acerca de las clases de cálculo personalizadas.

Especificaciones de pod

Selecciona un tipo y un número de acelerador compatibles en la especificación de tu pod, como en el siguiente ejemplo:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: gcr.io/google_containers/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Sustituye los siguientes valores:

  • POD_NAME: el nombre de tu Pod.
  • ACCELERATOR_NAME: el nombre del acelerador que requiere el pod.
  • ACCELERATOR_COUNT: número de aceleradores que necesita el pod.

Requisitos de configuración de los recursos de computación aptos

En las tablas de las siguientes secciones se describen los requisitos específicos de GKE para aprovisionar los recursos de computación pertinentes como nodos de inicio rápido.

Plataforma de computación optimizada para contenedores con piloto automático

Consulta los siguientes requisitos para que GKE aprovisione nodos de inicio rápido con la plataforma de computación optimizada para contenedores de Autopilot.

Recurso de computación Compatibilidad con canales de lanzamiento y versiones Tipos de máquinas, tipos de discos de arranque y tamaños admitidos
Plataforma de computación optimizada para contenedores de Autopilot
  • Canal rápido
  • 1.33.0-gke.1696000 o versiones posteriores
  • pd-balanced discos de hasta 100 GiB
  • No hay SSD locales.

Serie de máquinas G2

Consulta los siguientes requisitos para que GKE aprovisione máquinas G2 como nodos de inicio rápido.

Recurso de computación Compatibilidad con canales de lanzamiento y versiones Tipos de máquinas, tipos de discos de arranque y tamaños admitidos
Serie de máquinas G2
  • Canales Rápido y Habitual
  • 1.31 o posterior
  • pd-balanced discos de hasta 500 GiB
  • No hay SSD locales.

Serie de máquinas A2

Consulta los siguientes requisitos para que GKE aprovisione máquinas A2 como nodos de inicio rápido. La serie de máquinas A2 está disponible para los clústeres que ejecutan la versión 1.32.0-gke.1008000 o posterior de GKE y que están registrados en los canales Rápido u Ordinario.

Recurso de computación Regiones Tipos de máquinas, tipos de discos de arranque y tamaños admitidos
a2-highgpu-1g
  • asia-northeast1
  • asia-southeast1
  • europe-west4
  • me-west1
  • us-central1
  • us-west1
  • us-west4
  • pd-balanced o pd-ssd hasta 1000 GiB.
  • No hay SSD locales.
a2-highgpu-2g
  • asia-southeast1
  • us-central1
  • us-west1
  • pd-balanced o pd-ssd hasta 1000 GiB.
  • No hay SSD locales.
a2-megagpu-16g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd hasta 1000 GiB.
  • No hay SSD locales.
a2-ultragpu-1g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd hasta 1000 GiB.
  • Se incluye 1 SSD local con 375 GiB.
a2-ultragpu-2g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd hasta 1000 GiB.
  • Se incluyen 2 SSD locales, cada uno con 375 GiB.
a2-ultragpu-4g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd de 1500 GiB.
  • Se incluyen 4 SSD locales, cada uno con 375 GiB.
a2-ultragpu-8g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd de 3000 GiB.
  • Se incluyen 8 SSD locales, cada uno con 375 GiB.

Precios

Los nodos de inicio rápido están disponibles en Autopilot de GKE sin coste adicional. Para obtener más información sobre los precios de Autopilot de GKE, consulta la sección sobre el modo Autopilot en la página Precios de Google Kubernetes Engine.

Siguientes pasos