Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Ottimizza il rendimento del pod Autopilot scegliendo una serie di macchine

Autopilot

Questo documento mostra come inserire i workload in una serie di macchine Compute Engine specifica per ottenere prestazioni ottimali dei workload nei cluster Google Kubernetes Engine (GKE) Autopilot.

Assicurati di conoscere i seguenti argomenti:

Serie di macchine Compute Engine e casi d'uso
Requisiti a livello di kernel per le applicazioni

Come funziona la selezione della serie di macchine

Puoi aggiungere un selettore di nodi cloud.google.com/machine-family alla specifica del pod per Autopilot per allocare hardware Compute Engine specifico per quel pod. Ad esempio, puoi scegliere la serie di macchine C3 per i pod che richiedono più potenza di CPU o la serie di macchine N1 per i pod che richiedono più memoria. Per eseguire il workload in modo ottimale, Autopilot esegue il provisioning di uno dei tipi di macchine predefiniti della serie di macchine selezionata.

Oltre alle prestazioni ottimali dei pod, la scelta di una serie di macchine specifica offre i seguenti vantaggi:

Utilizzo efficiente dei nodi: per impostazione predefinita, Autopilot ottimizza l'utilizzo delle risorse dei nodi pianificando su ogni nodo il maggior numero possibile di pod che richiedono la stessa serie di macchine. Questo approccio ottimizza l'utilizzo delle risorse sul nodo, il che migliora il rapporto prezzo/prestazioni. Se il workload deve accedere a tutte le risorse del nodo, puoi configurarlo in modo che richieda un pod per ogni nodo.
Workload con burst: puoi configurare i pod in modo che eseguano il burst nella capacità delle risorse inutilizzate sul nodo impostando i limiti delle risorse superiori alle richieste. Per maggiori dettagli, consulta Configurare il bursting dei pod in GKE.

Pianificare un nodo dedicato per ogni pod

Se hai workload che richiedono un uso intensivo della CPU e che necessitano di un accesso affidabile a tutte le risorse del nodo, puoi configurare il pod in modo che Autopilot inserisca un pod che richiede una serie di macchine sul proprio nodo.

I nodi dedicati per pod sono consigliati quando esegui workload su larga scala che richiedono un uso intensivo della CPU, come i workload di addestramento AI/ML o i workload batch di computing ad alte prestazioni (HPC).

Scegliere tra la pianificazione di più pod e di un singolo pod

Utilizza le seguenti indicazioni per scegliere un comportamento di pianificazione dei pod in base ai tuoi requisiti:

Se hai pod che possono condividere le risorse di computing con altri pod o vuoi ottimizzare i costi durante l'esecuzione dei pod su hardware specializzato, utilizza il comportamento di pianificazione predefinito di più pod per nodo.
Se hai pod che richiedono un accesso affidabile alle risorse complete dei nodi o vuoi ridurre al minimo la possibilità di interruzioni causate dalla condivisione delle risorse di computing, richiedi un nodo dedicato per ogni pod.

Prezzi

Ti viene addebitato il costo della VM sottostante e di qualsiasi hardware collegato da Compute Engine, oltre a un premio per la gestione e la scalabilità dei nodi Autopilot. Per maggiori dettagli, consulta Prezzi di GKE.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti attività:

Abilita l'API Google Kubernetes Engine.

Abilita l'API Google Kubernetes Engine

Se vuoi utilizzare Google Cloud CLI per questa attività, installala e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, scarica l'ultima versione eseguendo il gcloud components update comando. Le versioni precedenti di gcloud CLI potrebbero non supportare l'esecuzione dei comandi in questo documento.
Nota: per le installazioni esistenti di gcloud CLI assicurati di impostare la compute/region proprietà. Se utilizzi principalmente cluster zonali, imposta invece compute/zone. Se imposti una località predefinita, puoi evitare errori in gcloud CLI come il seguente: One of [--zone, --region] must be supplied: Please specify location. Potresti dover specificare la posizione in determinati comandi se la posizione del cluster è diversa da quella predefinita che hai impostato.

Assicurati di avere un cluster Autopilot esistente con la versione 1.30.1-gke.1396000 o successive. Per creare un cluster, vedi Crea un cluster Autopilot.

Selezionare una serie di macchine

Questa sezione mostra come selezionare una serie di macchine Compute Engine specifica in un pod.

Salva il seguente manifest come machine-series-pod.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: machine-series-pod
spec:
  nodeSelector:
    cloud.google.com/machine-family: MACHINE_SERIES
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 5
        memory: "25Gi"
      limits:
        cpu: 20
        memory: 100Gi

Sostituisci MACHINE_SERIES con la serie di macchine Compute Engine per il pod, ad esempio c3. Per i valori supportati, consulta Serie di macchine supportate in questa pagina.

Esegui il deployment del pod:

kubectl apply -f machine-series-pod.yaml

Questo manifest consente ad Autopilot di ottimizzare l'utilizzo delle risorse dei nodi pianificando in modo efficiente altri pod che selezionano la stessa serie di macchine sullo stesso nodo se è disponibile capacità.

Utilizzare gli SSD locali

I pod che selezionano una serie di macchine possono utilizzare gli SSD locali per lo spazio di archiviazione temporaneo se specifichi una serie di macchine che offre SSD locali. Autopilot considera le richieste di spazio di archiviazione temporaneo quando sceglie un tipo di macchina Compute Engine per il pod.

Per saperne di più, consulta Utilizzare lo spazio di archiviazione temporaneo basato su SSD locali con i cluster Autopilot.

Richiedere un nodo dedicato per un pod

Se il pod ha requisiti di prestazioni specifici, ad esempio la necessità di un accesso affidabile a tutte le risorse del nodo, puoi richiedere un nodo dedicato per ogni pod specificando il selettore di nodi cloud.google.com/compute-class: Performance insieme al selettore di nodi della serie di macchine. In questo modo, Autopilot inserisce il pod su un nuovo nodo che utilizza la serie di macchine specificata ed è dedicato a quel pod. Questo selettore di nodi impedisce inoltre ad Autopilot di pianificare altri pod su quel nodo.

Salva il seguente manifest come dedicated-node-pod.yaml:

apiVersion: v1
kind: Pod
metadata:
  name: dedicated-node-pod
spec:
  nodeSelector:
    cloud.google.com/machine-family: MACHINE_SERIES
    cloud.google.com/compute-class: Performance
  containers:
  - name: my-container
    image: "k8s.gcr.io/pause"
    resources:
      requests:
        cpu: 12
        memory: "50Gi"
        ephemeral: "200Gi"

Sostituisci MACHINE_SERIES con una serie di macchine supportata che supporta anche la pianificazione di un pod per nodo. Se la serie di macchine specificata non supporta la pianificazione di un pod per nodo, il deployment non riesce e viene visualizzato un errore.

Esegui il deployment del pod:

kubectl apply -f dedicated-node-pod.yaml

Quando esegui il deployment di questo manifest, Autopilot esegue le seguenti operazioni:

Assicura che il pod di cui è stato eseguito il deployment richieda almeno le risorse minime per il nodo ottimizzato per le prestazioni.
Calcola le richieste di risorse totali del pod di cui è stato eseguito il deployment e di tutti i DaemonSet nel cluster.
Esegue il provisioning di un nodo supportato dalla serie di macchine selezionata.
Modifica il manifest del pod con una combinazione di selettori di nodi e tolleranze per garantire che il pod venga eseguito sul proprio nodo.

Serie di macchine supportate

Il selettore machine-family supporta le seguenti serie di macchine:

Serie di macchine	Valore del selettore di nodi	Supporta più pod per nodo	Supporta un singolo pod per nodo
Serie di macchine C4D (vedi Requisiti della versione)	`c4d`
Serie di macchine C4A (vedi requisiti e limitazioni)	`c4a`
Serie di macchine C4 Valore predefinito per la classe Performance	`c4`
Serie di macchine C3	`c3`
Serie di macchine C3D	`c3d`
Serie di macchine C2	`c2`
Serie di macchine C2D	`c2d`
Serie di macchine H4D	`h4d`
Serie di macchine H3	`h3`
Serie di macchine T2D	`t2d`
Serie di macchine T2A	`t2a`
Serie di macchine E2	`e2`
Serie di macchine N4	`n4`
Serie di macchine N4D	`n4d`
Serie di macchine N2	`n2`
Serie di macchine N2D	`n2d`
Serie di macchine N1	`n1`
Serie di macchine Z3	`z3`

Se non specifichi una serie di macchine quando selezioni la classe Performance, GKE utilizza la serie di macchine C4 se i tipi di macchine C4 sono disponibili in una regione.

Per confrontare queste serie di macchine e i relativi casi d'uso, consulta Confronto tra le serie di macchine nella documentazione di Compute Engine.

Requisiti della versione

La serie di macchine C4D è disponibile con GKE versione 1.32.9-gke.1711000 e successive.

Compatibilità con altre funzionalità di GKE

I pod che selezionano una serie di macchine possono utilizzare le funzionalità di GKE supportate da quella serie di macchine, ad esempio:

Pod spot
Pod con runtime esteso (solo con nodi dedicati per pod)
Separazione dei workload
Prenotazioni di capacità
Sconti per impegno di utilizzo

I pod spot e i pod con runtime esteso si escludono a vicenda. GKE non applica richieste di risorse minime più elevate per i pod dedicati per nodo, anche se utilizzano la separazione dei workload.

In che modo GKE seleziona un tipo di macchina

Per selezionare un tipo di macchina nella serie di macchine specificata, GKE calcola le richieste totali di CPU, memoria e spazio di archiviazione temporaneo dei pod e di tutti i DaemonSet che verranno eseguiti sul nuovo nodo. GKE arrotonda questi valori al tipo di macchina Compute Engine disponibile più vicino che supporta tutti questi totali.

Esempio 1: considera un deployment con quattro repliche che seleziona la serie di macchine C3D. Non richiedi nodi dedicati per pod. Le richieste di risorse di ogni replica sono le seguenti:
- 500 mCPU (0,5 vCPU)
- 1 GiB di memoria
Autopilot inserisce tutti e quattro i pod su un nodo supportato dal tipo di macchina c3d-standard-4, che ha 4 vCPU e 16 GB di memoria.
Esempio 2: considera un pod che seleziona la serie di macchine C3D e gli SSD locali per lo spazio di archiviazione temporaneo. Richiedi un nodo dedicato per il pod. Le richieste di risorse totali, inclusi i DaemonSet, sono le seguenti:
- 12 vCPU
- 50 GiB di memoria
- 200 GiB di spazio di archiviazione temporaneo
Autopilot inserisce il pod su un nodo che utilizza il tipo di macchina c3d-standard-16-lssd, che ha 16 vCPU, 64 GiB di memoria e 365 GiB di capacità SSD locale.

Passaggi successivi

Per indicazioni sulle opzioni di computing offerte da Autopilot per vari casi d'uso, consulta Classi di computing in Autopilot.
Esegui il deployment dei workload basati su GPU in Autopilot.