Google utiliza tecnología de IA para traducir contenido a tu idioma preferido. Las traducciones realizadas con IA pueden contener errores.

Acerca del inicio más rápido de cargas de trabajo con nodos de inicio rápido

Autopilot

En esta página, se muestra cómo implementar y escalar cargas de trabajo más rápido en clústeres de Google Kubernetes Engine (GKE) con nodos de inicio rápido. Los nodos de inicio rápido se usan en GKE con el modo Autopilot de la mejor manera posible cuando las cargas de trabajo usan configuraciones compatibles.

Los nodos de GKE de inicio rápido tienen un tiempo de inicio significativamente menor para las familias de máquinas compatibles. El tiempo de inicio acelerado te brinda los siguientes beneficios:

Inicio en frío más rápido
Ajuste de escala automático más rápido
Mejora la latencia de cola larga de la programación de Pods
Mejora la eficiencia de los costos de infraestructura

Con los nodos de inicio rápido, GKE inicializa previamente los recursos de hardware para acelerar el tiempo de inicio. Los recursos inicializados previamente están disponibles de la mejor manera posible. Es posible que las solicitudes de aumento solo se publiquen de forma parcial. Sin nodos de inicio rápido, los recursos se inicializan a pedido y los nodos se publican en el tiempo de inicio normal.

Requisitos

Los nodos de inicio rápido no requieren configuración adicional. GKE usa automáticamente nodos de inicio rápido si tus cargas de trabajo usan configuraciones compatibles. Debes cumplir con todos los siguientes requisitos para usar nodos de inicio rápido:

Usa clústeres de Autopilot o ejecuta cargas de trabajo en el modo Autopilot en tus clústeres Standard.
No uses ninguna función que sea incompatible con los nodos de inicio rápido. Para obtener más información, consulta Limitaciones.
Usa uno de los siguientes recursos de procesamiento que se describen en las tablas respectivas de la sección Requisitos de configuración para recursos de procesamiento aptos:

Limitaciones

Las siguientes funciones no son compatibles con los nodos de GKE de inicio rápido. Si usas alguna de estas funciones, GKE aprovisiona nodos con el tiempo de inicio típico:

G2 con la versión del controlador de GPU DEFAULT en versiones de GKE anteriores a la 1.33.0-gke.1304000. Para la versión 1.33.0-gke.1304000 o posterior, LATEST y DEFAULT funcionan con nodos de inicio rápido.
Discos de arranque secundarios en versiones anteriores a la 1.33.2-gke.1015000.
VMs Spot
Políticas de ubicación
Compatibilidad con varias redes

Cargas de trabajo de GPU de Autopilot

Solicitar GPU compatibles en el modo Autopilot genera un tiempo de inicio de nodos hasta cuatro veces más rápido y un tiempo de programación de Pods hasta dos veces más rápido que las solicitudes similares en el modo Standard de GKE, ya que las cargas de trabajo de GPU de Autopilot pueden usar nodos de inicio rápido.

Estos son algunos ejemplos de casos de uso. Sin embargo, cualquier Pod que cumpla con las condiciones de la sección Requisitos es compatible con los nodos de inicio rápido.

ComputeClass

Solicita un tipo y un recuento de acelerador compatibles en una ComputeClass, como en el siguiente ejemplo:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

Cuando seleccionas esta ComputeClass en un Pod, como en el siguiente ejemplo, GKE usa nodos de inicio rápido:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Reemplaza los siguientes valores:

ACCELERATOR_COMPUTE_CLASS_NAME: Es el nombre de la ComputeClass que solicita los aceleradores.
ACCELERATOR_TYPE: Es el tipo de acelerador.
ACCELERATOR_COUNT: Es la cantidad de aceleradores que requiere el Pod. Este valor debe ser menor o igual que el valor del campo spec.priorities.gpu.count en ComputeClass.
POD_NAME: Es el nombre del Pod.

Para obtener más información sobre ComputeClass, consulta Acerca de las clases de procesamiento personalizadas.

Especificación del Pod

Selecciona un tipo y un recuento de acelerador compatibles en la especificación de tu Pod, como en el siguiente ejemplo:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Reemplaza los siguientes valores:

POD_NAME: Es el nombre del Pod.
ACCELERATOR_NAME: Es el nombre del acelerador que requiere el Pod.
ACCELERATOR_COUNT: Es la cantidad de aceleradores que requiere el Pod.

Requisitos de configuración para recursos de procesamiento aptos

En las tablas de las siguientes secciones, se describen los requisitos específicos para que GKE aprovisione los recursos de procesamiento pertinentes como nodos de inicio rápido.

Plataforma de procesamiento optimizada para contenedores de Autopilot

Consulta los siguientes requisitos para que GKE aprovisione nodos de inicio rápido con la plataforma de procesamiento optimizada para contenedores de Autopilot.

Recurso de procesamiento	Compatibilidad con canales de versiones y versiones	Discos compatibles
Plataforma de procesamiento optimizada para contenedores de Autopilot	Canal rápido 1.33.0-gke.1696000 o posterior	Discos de arranque `pd-balanced` de hasta 100 GiB Sin SSD locales

Serie de máquinas G2

Consulta los siguientes requisitos para que GKE aprovisione máquinas G2 como nodos de inicio rápido.

Recurso de procesamiento	Compatibilidad con canales de versiones y versiones	Discos compatibles
Serie de máquinas G2	Canales rápido y regular 1.31 o posterior	Discos de arranque `pd-balanced` de hasta 500 GiB Sin SSD locales

Serie de máquinas A2

Consulta los siguientes requisitos para que GKE aprovisione máquinas A2 como nodos de inicio rápido.

Recurso de procesamiento	Compatibilidad con canales de versiones y versiones	Discos compatibles
Tipos de máquinas A2 Standard	Canales rápido y regular 1.32.0-gke.1008000 o posterior	Discos de arranque `pd-balanced` o `pd-ssd` de hasta 1,000 GiB Sin SSD locales
Tipos de máquinas A2 Ultra	Canales rápido y regular 1.32.0-gke.1008000 o posterior	`pd-balanced` o `pd-ssd` discos de arranque de hasta 1,000 GiB, con límites más altos para `a2‑ultragpu‑4g` (1,500 GiB) y `a2‑ultragpu‑8g` (3,000 GiB). Con SSD locales conectadas automáticamente.

Tipo de máquina A3 Mega

Consulta los siguientes requisitos para que GKE aprovisione máquinas A3 Mega como nodos de inicio rápido.

Recurso de procesamiento	Compatibilidad con canales de versiones y versiones	Discos compatibles
Tipo de máquina A3 Mega	Canal rápido 1.34.4-gke.1130000 o posterior	Discos de arranque `hyperdisk-balanced`, `pd-ssd` o `pd-balanced` Con SSD locales conectadas automáticamente.

Serie de máquinas G4

Consulta los siguientes requisitos para que GKE aprovisione máquinas G4 como nodos de inicio rápido.

Recurso de procesamiento	Compatibilidad con canales de versiones y versiones	Discos compatibles
Serie de máquinas G4	Canal rápido 1.34.4-gke.1130000 o posterior	Discos de arranque `hyperdisk-balanced` Sin SSD locales

Precios

Los nodos de inicio rápido están disponibles en GKE Autopilot sin cargo adicional. Para obtener más información sobre los precios de GKE Autopilot, consulta la sección Modo Autopilot en Precios de Google Kubernetes Engine.

Acerca del inicio más rápido de cargas de trabajo con nodos de inicio rápido Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.