O Google usa tecnologia de IA na tradução de conteúdos para seu idioma de preferência. As traduções com IA podem ter erros.

Sobre a inicialização mais rápida de cargas de trabalho com nós de início rápido

Autopilot

Nesta página, mostramos como implantar e escalonar cargas de trabalho mais rapidamente em clusters do Google Kubernetes Engine (GKE) usando nós de inicialização rápida. Os nós de inicialização rápida são usados no GKE com o modo Autopilot da melhor maneira possível quando as cargas de trabalho usam configurações compatíveis.

Os nós do GKE de inicialização rápida têm um tempo de inicialização significativamente menor para famílias de máquinas compatíveis. O tempo de inicialização acelerado oferece os seguintes benefícios:

Inicialização a frio mais rápida
Escalonamento automático mais rápido
Latência de cauda longa de programação de pods aprimorada
Melhoria da eficiência de custos da infraestrutura

Com nós de inicialização rápida, o GKE pré-inicializa os recursos de hardware para acelerar o tempo de inicialização. Os recursos pré-inicializados estão disponíveis da melhor maneira possível. As solicitações de pico podem ser atendidas apenas parcialmente. Sem nós de inicialização rápida, os recursos são inicializados sob demanda e os nós são atendidos no tempo de inicialização normal.

Requisitos

Os nós de inicialização rápida não exigem configuração adicional. O GKE usa nós de inicialização rápida automaticamente se as cargas de trabalho usarem configurações compatíveis. Você precisa atender a todos os requisitos a seguir para usar nós de inicialização rápida:

Use clusters do Autopilot ou execute cargas de trabalho no modo Autopilot nos clusters Standard .
Não use recursos incompatíveis com nós de inicialização rápida. Para mais informações, consulte Limitações.
Use um dos seguintes recursos de computação descritos nas respectivas tabelas na seção Requisitos de configuração para recursos de computação qualificados:

Limitações

Os recursos a seguir não são compatíveis com nós do GKE de inicialização rápida. Se você usar algum desses recursos, o GKE vai provisionar nós com o tempo de inicialização típico:

G2 com a versão do driver de GPU DEFAULT em versões do GKE anteriores à 1.33.0-gke.1304000. Para a versão 1.33.0-gke.1304000 ou mais recente, LATEST e DEFAULT funcionam com nós de inicialização rápida.
Discos de inicialização secundários em versões anteriores à 1.33.2-gke.1015000.
Spot VMs
Políticas de posicionamento
Suporte a várias redes

Cargas de trabalho da GPU do Autopilot

A solicitação de GPUs compatíveis no modo Autopilot resulta em um tempo de inicialização de nós até quatro vezes mais rápido e um tempo de programação de pods até duas vezes mais rápido do que solicitações semelhantes no modo GKE Standard, porque as cargas de trabalho da GPU do Autopilot podem usar nós de inicialização rápida.

Confira alguns exemplos de casos de uso: No entanto, todos os pods que atendem às condições da seção Requisitos são compatíveis com nós de inicialização rápida.

ComputeClass

Solicite um tipo e uma contagem de aceleradores compatíveis em uma ComputeClass, como no exemplo a seguir:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

Quando você seleciona essa ComputeClass em um pod, como no exemplo a seguir, o GKE usa nós de inicialização rápida:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Substitua os seguintes valores:

ACCELERATOR_COMPUTE_CLASS_NAME: o nome da ComputeClass que solicita os aceleradores.
ACCELERATOR_TYPE: o tipo de acelerador.
ACCELERATOR_COUNT: o número de aceleradores exigidos pelo pod. Esse valor precisa ser menor ou igual ao valor no campo spec.priorities.gpu.count na ComputeClass.
POD_NAME: o nome do pod.

Para mais informações sobre a ComputeClass, consulte Sobre as classes de computação personalizadas.

Especificação do pod

Selecione um tipo e uma contagem de aceleradores compatíveis na especificação do pod, como no exemplo a seguir:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Substitua os seguintes valores:

POD_NAME: o nome do pod.
ACCELERATOR_NAME: o nome do acelerador exigido pelo pod.
ACCELERATOR_COUNT: o número de aceleradores exigidos pelo pod.

Requisitos de configuração para recursos de computação qualificados

As tabelas nas seções a seguir descrevem os requisitos específicos para que o GKE provisione os recursos de computação relevantes como nós de inicialização rápida.

Plataforma de computação otimizada para contêineres do Autopilot

Consulte os requisitos a seguir para que o GKE provisione nós de inicialização rápida com a plataforma de computação otimizada para contêineres do Autopilot.

Recurso de computação	Suporte a canais de lançamento e versões	Discos compatíveis
Plataforma de computação otimizada para contêineres do Autopilot	Canal rápido 1.33.0-gke.1696000 ou mais recente	Discos de inicialização `pd-balanced` de até 100 GiB Sem SSDs locais.

Série de máquinas G2

Consulte os requisitos a seguir para que o GKE provisione máquinas G2 como nós de inicialização rápida.

Recurso de computação	Suporte a canais de lançamento e versões	Discos compatíveis
Série de máquinas G2	Canais rápido e regular 1.31 ou mais recente	Discos de inicialização `pd-balanced` de até 500 GiB Sem SSDs locais.

Série de máquinas A2

Consulte os requisitos a seguir para que o GKE provisione máquinas A2 como nós de inicialização rápida.

Recurso de computação	Suporte a canais de lançamento e versões	Discos compatíveis
Tipos de máquina A2 padrão	Canais rápido e regular 1.32.0-gke.1008000 ou mais recente	Discos de inicialização `pd-balanced` ou `pd-ssd` de até 1.000 GiB. Sem SSDs locais.
Tipos de máquina A2 Ultra	Canais rápido e regular 1.32.0-gke.1008000 ou mais recente	`pd-balanced` ou `pd-ssd` discos de inicialização de até 1.000 GiB, com limites mais altos para `a2‑ultragpu‑4g` (1.500 GiB) e `a2‑ultragpu‑8g` (3.000 GiB). Com SSDs locais anexados automaticamente.

Tipo de máquina A3 Mega

Consulte os requisitos a seguir para que o GKE provisione máquinas A3 Mega como nós de inicialização rápida.

Recurso de computação	Suporte a canais de lançamento e versões	Discos compatíveis
Tipo de máquina A3 Mega	Canal rápido 1.34.4-gke.1130000 ou mais recente	Discos de inicialização `hyperdisk-balanced`, `pd-ssd` ou `pd-balanced`. Com SSDs locais anexados automaticamente.

Série de máquinas G4

Consulte os requisitos a seguir para que o GKE provisione máquinas G4 como nós de inicialização rápida.

Recurso de computação	Suporte a canais de lançamento e versões	Discos compatíveis
Série de máquinas G4	Canal rápido 1.34.4-gke.1130000 ou mais recente	Discos de inicialização `hyperdisk-balanced` Sem SSDs locais.

Preços

Os nós de inicialização rápida estão disponíveis no GKE Autopilot sem custo extra. Para mais informações sobre os preços do GKE Autopilot, consulte a seção Modo Autopilot em Preços do Google Kubernetes Engine.

Sobre a inicialização mais rápida de cargas de trabalho com nós de início rápido Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.