Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Informazioni sull'avvio più rapido dei carichi di lavoro con i nodi ad avvio rapido

Autopilot

Questa pagina mostra come eseguire il deployment e scalare i carichi di lavoro più rapidamente nei cluster Google Kubernetes Engine (GKE) utilizzando nodi ad avvio rapido. I nodi ad avvio rapido vengono utilizzati in GKE con la modalità Autopilot in base al principio del best-effort quando i carichi di lavoro utilizzano configurazioni compatibili.

I nodi GKE ad avvio rapido hanno un tempo di avvio notevolmente inferiore per le famiglie di macchine compatibili. Il tempo di avvio accelerato offre i seguenti vantaggi:

Avvio a freddo più rapido
Scalabilità automatica più rapida
Latenza long-tail della pianificazione dei pod migliorata
Efficienza dei costi dell'infrastruttura migliorata

Con i nodi ad avvio rapido, GKE pre-inizializza le risorse hardware per accelerare il tempo di avvio. Le risorse pre-inizializzate sono disponibili in base al principio del best-effort. Le richieste di picco potrebbero essere soddisfatte solo parzialmente. Senza i nodi ad avvio rapido, le risorse vengono inizializzate on demand e i nodi vengono pubblicati al normale tempo di avvio.

Requisiti

I nodi ad avvio rapido non richiedono configurazioni aggiuntive. GKE utilizza automaticamente i nodi ad avvio rapido se i carichi di lavoro utilizzano configurazioni compatibili. Per utilizzare i nodi ad avvio rapido, devi soddisfare tutti i seguenti requisiti:

Utilizza i cluster Autopilot o esegui i carichi di lavoro in modalità Autopilot nei cluster Standard.
Non utilizzare funzionalità incompatibili con i nodi ad avvio rapido. Per saperne di più, consulta Limitazioni.
Utilizza una delle seguenti risorse di computing descritte nelle rispettive tabelle nella sezione Requisiti di configurazione per le risorse di computing idonee:

Limitazioni

Le seguenti funzionalità non sono compatibili con i nodi GKE ad avvio rapido. Se utilizzi una di queste funzionalità, GKE esegue il provisioning dei nodi con il tempo di avvio tipico:

G2 con la versione del driver GPU DEFAULT nelle versioni di GKE precedenti alla 1.33.0-gke.1304000. Per la versione 1.33.0-gke.1304000 o successive, sia LATEST sia DEFAULT funzionano con i nodi ad avvio rapido.
Dischi di avvio secondari nelle versioni precedenti alla 1.33.2-gke.1015000.
Chiavi di crittografia gestite dal cliente (CMEK)
VM spot
Criteri di posizionamento
Supporto multi-rete

Carichi di lavoro GPU Autopilot

La richiesta di GPU compatibili in modalità Autopilot comporta un tempo di avvio dei nodi fino a quattro volte più rapido e un tempo di pianificazione dei pod fino a due volte più rapido rispetto a richieste simili in modalità GKE Standard, perché i carichi di lavoro GPU Autopilot possono utilizzare nodi ad avvio rapido.

Ecco alcuni casi d'uso di esempio. Tuttavia, tutti i pod che soddisfano le condizioni della sezione Requisiti sono compatibili con i nodi ad avvio rapido.

ComputeClass

Richiedi un tipo e un conteggio di acceleratori compatibili in una ComputeClass, come nell'esempio seguente:

apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
  name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
  priorities:
  - gpu:
      type: ACCELERATOR_TYPE
      count: ACCELERATOR_COUNT
  nodePoolAutoCreation:
    enabled: true

Quando selezioni questa ComputeClass in un pod, come nell'esempio seguente, GKE utilizza nodi ad avvio rapido:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    # Select a ComputeClass that requests compatible GPUs
    cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Sostituisci i seguenti valori:

ACCELERATOR_COMPUTE_CLASS_NAME: il nome della ComputeClass che richiede gli acceleratori.
ACCELERATOR_TYPE: il tipo di acceleratore.
ACCELERATOR_COUNT: il numero di acceleratori richiesti dal pod. Questo valore deve essere minore o uguale al valore nel campo spec.priorities.gpu.count in ComputeClass.
POD_NAME: il nome del pod.

Per saperne di più su ComputeClass, consulta Informazioni sulle classi di computing personalizzate.

Specifica pod

Seleziona un tipo e un conteggio di acceleratori compatibili nella specifica del pod, come nell'esempio seguente:

apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
spec:
  nodeSelector:
    cloud.google.com/gke-accelerator: ACCELERATOR_NAME
  containers:
  - name: my-container
    image: registry.k8s.io/pause
    resources:
      limits:
        nvidia.com/gpu: ACCELERATOR_COUNT

Sostituisci i seguenti valori:

POD_NAME: il nome del pod.
ACCELERATOR_NAME: il nome dell'acceleratore richiesto dal pod.
ACCELERATOR_COUNT: il numero di acceleratori richiesti dal pod.

Requisiti di configurazione per le risorse di computing idonee

Le tabelle nelle sezioni seguenti descrivono i requisiti specifici per GKE per eseguire il provisioning delle risorse di computing pertinenti come nodi ad avvio rapido.

Piattaforma di computing ottimizzata per container Autopilot

Consulta i seguenti requisiti per GKE per eseguire il provisioning di nodi ad avvio rapido con la piattaforma di computing ottimizzata per container Autopilot.

Risorsa di computing	Supporto per canale di rilascio e versione	Dischi supportati
Piattaforma di computing ottimizzata per container Autopilot	Canale rapido 1.33.0-gke.1696000 o versioni successive	Dischi di avvio `pd-balanced` fino a 100 GiB Nessun SSD locale.

Serie di macchine G2

Consulta i seguenti requisiti per GKE per eseguire il provisioning delle macchine G2 come nodi ad avvio rapido.

Risorsa di computing	Supporto per canale di rilascio e versione	Dischi supportati
Serie di macchine G2	Canali rapido e regolare 1.31 o versioni successive	Dischi di avvio `pd-balanced` fino a 500 GiB Nessun SSD locale.

Serie di macchine A2

Consulta i seguenti requisiti per GKE per eseguire il provisioning delle macchine A2 come nodi ad avvio rapido.

Risorsa di computing	Supporto per canale di rilascio e versione	Dischi supportati
Tipi di macchine standard A2	Canali rapido e regolare 1.32.0-gke.1008000 o versioni successive	Dischi di avvio `pd-balanced` o `pd-ssd` fino a 1000 GiB. Nessun SSD locale.
Tipi di macchine A2 Ultra	Canali rapido e regolare 1.32.0-gke.1008000 o versioni successive	`pd-balanced` o `pd-ssd` dischi di avvio fino a 1000 GiB, con limiti più elevati per `a2‑ultragpu‑4g` (1500 GiB) e `a2‑ultragpu‑8g` (3000 GiB). Con SSD locali collegati automaticamente.

Tipo di macchina A3 Mega

Consulta i seguenti requisiti per GKE per eseguire il provisioning delle macchine A3 Mega come nodi ad avvio rapido.

Risorsa di computing	Supporto per canale di rilascio e versione	Dischi supportati
Tipo di macchina A3 Mega	Canale rapido 1.34.4-gke.1130000 o versioni successive	Dischi di avvio `hyperdisk-balanced`, `pd-ssd` o `pd-balanced`. Con SSD locali collegati automaticamente.

Serie di macchine G4

Consulta i seguenti requisiti per GKE per eseguire il provisioning delle macchine G4 come nodi ad avvio rapido.

Risorsa di computing	Supporto per canale di rilascio e versione	Dischi supportati
Serie di macchine G4	Canale rapido 1.34.4-gke.1130000 o versioni successive	Dischi di avvio `hyperdisk-balanced` Nessun SSD locale.

Prezzi

I nodi ad avvio rapido sono disponibili in GKE Autopilot senza costi aggiuntivi. Per saperne di più sui prezzi di GKE Autopilot, consulta la sezione Modalità Autopilot in Prezzi di Google Kubernetes Engine.

Informazioni sull'avvio più rapido dei carichi di lavoro con i nodi ad avvio rapido Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.