Informazioni sull'avvio più rapido dei carichi di lavoro con i nodi ad avvio rapido

Questa pagina mostra come eseguire il deployment e lo scale dei workload più rapidamente nei cluster Google Kubernetes Engine (GKE) utilizzando nodi a avvio rapido. I nodi a avvio rapido vengono utilizzati in GKE con la modalità Autopilot in base al miglior impegno quando i carichi di lavoro utilizzano configurazioni compatibili.

I nodi GKE ad avvio rapido hanno tempi di avvio notevolmente inferiori per le famiglie di macchine compatibili. Il tempo di avvio più rapido offre i seguenti vantaggi:

  • Avvio completo più rapido
  • Scalabilità automatica più rapida
  • Latenza della coda lunga della pianificazione dei pod migliorata
  • Maggiore efficienza dei costi dell'infrastruttura

Con i nodi ad avvio rapido, GKE preinizializza le risorse hardware per accelerare il tempo di avvio. Le risorse pre-inizializzate sono disponibili in base al principio del "best effort". Le richieste di picco potrebbero essere soddisfatte solo parzialmente. Senza nodi di avvio rapido, le risorse vengono inizializzate on demand e i nodi vengono pubblicati al normale tempo di avvio.

Requisiti

I nodi con avvio rapido non richiedono configurazioni aggiuntive. GKE utilizza automaticamente i nodi a avvio rapido se i tuoi workload utilizzano configurazioni compatibili. Per utilizzare i nodi di avvio rapido, devi soddisfare tutti i seguenti requisiti:

Limitazioni

Le seguenti funzionalità non sono compatibili con i nodi GKE a avvio rapido. Se utilizzi una di queste funzionalità, GKE esegue il provisioning dei nodi con il tempo di avvio tipico:

Workload GPU Autopilot

La richiesta di GPU compatibili in modalità Autopilot comporta un tempo di avvio dei nodi fino a quattro volte più rapido e un tempo di pianificazione dei pod fino a due volte più rapido rispetto a richieste simili in modalità GKE Standard, perché i carichi di lavoro GPU Autopilot possono utilizzare nodi ad avvio rapido.

Di seguito sono riportati alcuni casi d'uso di esempio. Tuttavia, tutti i pod che soddisfano le condizioni della sezione Requisiti sono compatibili con i nodi a avvio rapido.

ComputeClass

Richiedi un tipo e un conteggio di acceleratore compatibili in un ComputeClass, come nel seguente esempio:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

Quando selezioni questa ComputeClass in un pod, come nell'esempio seguente, GKE utilizza nodi a avvio rapido:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: gcr.io/google_containers/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Sostituisci i seguenti valori:

  • ACCELERATOR_COMPUTE_CLASS_NAME: il nome di ComputeClass che richiede gli acceleratori.
  • ACCELERATOR_TYPE: il tipo di acceleratore.
  • ACCELERATOR_COUNT: il numero di acceleratori richiesti dal pod. Questo valore deve essere minore o uguale a quello del campo spec.priorities.gpu.count in ComputeClass.
  • POD_NAME: il nome del pod.

Per ulteriori informazioni su ComputeClass, consulta Informazioni sulle classi di computing personalizzate.

Specifica pod

Seleziona un tipo e un conteggio di acceleratore compatibili nella specifica del pod, come nell'esempio seguente:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: gcr.io/google_containers/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Sostituisci i seguenti valori:

  • POD_NAME: il nome del pod.
  • ACCELERATOR_NAME: il nome dell'acceleratore richiesto dal pod.
  • ACCELERATOR_COUNT: il numero di acceleratori richiesti dal pod.

Requisiti di configurazione per le risorse di calcolo idonee

Le tabelle nelle sezioni seguenti descrivono i requisiti specifici per GKE per il provisioning delle risorse di calcolo pertinenti come nodi a avvio rapido.

Piattaforma di computing ottimizzata per i container Autopilot

Consulta i seguenti requisiti per GKE per il provisioning di nodi ad avvio rapido con la piattaforma di computing ottimizzata per i container Autopilot.

Risorsa di computing Supporto per canale di rilascio e versione Tipi di macchine, tipi di dischi di avvio e dimensioni supportati
Piattaforma di calcolo ottimizzata per i container Autopilot
  • Canale rapido
  • 1.33.0-gke.1696000 o versioni successive
  • pd-balanced dischi fino a 100 GiB
  • Nessun SSD locale.

Serie di macchine G2

Consulta i seguenti requisiti per consentire a GKE di eseguire il provisioning delle macchine G2 come nodi a avvio rapido.

Risorsa di computing Supporto per canale di rilascio e versione Tipi di macchine, tipi di dischi di avvio e dimensioni supportati
Serie di macchine G2
  • Canali rapido e regolare
  • 1.31 o versioni successive
  • pd-balanced dischi fino a 500 GiB
  • Nessun SSD locale.

Serie di macchine A2

Consulta i seguenti requisiti per GKE per il provisioning delle macchine A2 come nodi a avvio rapido. La serie di macchine A2 è disponibile per i cluster che eseguono GKE versione 1.32.0-gke.1008000 o successive e sono registrati ai canali rapido o regolare.

Risorsa di computing Regioni Tipi di macchine, tipi di dischi di avvio e dimensioni supportati
a2-highgpu-1g
  • asia-northeast1
  • asia-southeast1
  • europe-west4
  • me-west1
  • us-central1
  • us-west1
  • us-west4
  • pd-balanced o pd-ssd fino a 1000 GiB.
  • Nessun SSD locale.
a2-highgpu-2g
  • asia-southeast1
  • us-central1
  • us-west1
  • pd-balanced o pd-ssd fino a 1000 GiB.
  • Nessun SSD locale.
a2-megagpu-16g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd fino a 1000 GiB.
  • Nessun SSD locale.
a2-ultragpu-1g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd fino a 1000 GiB.
  • È incluso 1 SSD locale con 375 GiB.
a2-ultragpu-2g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd fino a 1000 GiB.
  • Sono inclusi 2 SSD locali, ognuno con 375 GiB.
a2-ultragpu-4g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd di 1500 GiB.
  • Sono inclusi 4 SSD locali, ognuno con 375 GiB.
a2-ultragpu-8g
  • asia-southeast1
  • europe-west4
  • us-central1
  • pd-balanced o pd-ssd di 3000 GiB.
  • Sono inclusi 8 SSD locali, ognuno con 375 GiB.

Prezzi

I nodi a avvio rapido sono disponibili in GKE Autopilot senza costi aggiuntivi. Per saperne di più sui prezzi di GKE Autopilot, consulta la sezione Modalità Autopilot in Prezzi di Google Kubernetes Engine.

Passaggi successivi