Configura gli aggiornamenti inattivi dei pool di nodi

Questo documento descrive come attivare e gestire gli aggiornamenti inattivi dei pool di nodi. Per informazioni su come funzionano gli aggiornamenti in sovraccarico dei node pool, vedi Informazioni sugli aggiornamenti in sovraccarico.

Aspetti da considerare prima di eseguire gli aggiornamenti dei picchi

Prima di eseguire un aggiornamento dei prezzi dinamici, tieni presente quanto segue:

  • Le istanze aggiuntive create nell'ambito di questo passaggio di picco possono potenzialmente superare il limite della quota di istanze AWS. Se non disponi di quota sufficiente e non è possibile eseguire il provisioning di queste istanze aggiuntive, l'aggiornamento potrebbe non riuscire.
  • Se max-unavailable-update è impostato su 0, le interruzioni dei carichi di lavoro possono comunque verificarsi quando i pod vengono rimossi e riprogrammati sui nodi più recenti.
  • Il numero massimo di nodi che possono essere aggiornati contemporaneamente è uguale alla somma di max-surge-update e max-unavailable-update ed è limitato a 20.

Attivare e configurare gli aggiornamenti di sovraccarico

Per attivare gli aggiornamenti dei picchi, contatta Google Cloud l'assistenza. Dopo che il team di assistenza ha attivato la funzionalità, puoi assegnare valori ai parametri max-surge-update e max-unavailable-update durante la creazione o l'aggiornamento del pool di nodi:

Crea

gcloud container aws node-pools create NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \
    --max-surge-update MAX_SURGE \
    --max-unavailable-update MAX_UNAVAILABLE

Aggiorna

gcloud container aws node-pools update NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \
    --max-surge-update MAX_SURGE \
    --max-unavailable-update MAX_UNAVAILABLE

Sostituisci quanto segue:

  • NODE_POOL_NAME: il nome del pool di nodi da aggiornare.
  • CLUSTER_NAME: il nome del cluster.
  • GOOGLE_CLOUD_LOCATION: la regione supportata Google Cloud che gestisce il cluster. Ad esempio: us-west1.
  • MAX_SURGE: il numero massimo di nodi aggiuntivi che possono essere creati temporaneamente oltre la dimensione attuale del pool di nodi durante un aggiornamento. Modificando questo valore, puoi controllare il numero di nodi aggiornati contemporaneamente. L'impostazione predefinita è 1, ma puoi impostarla su 0. Se imposti max-surge-update su un valore maggiore di 0, GKE su AWS crea nodi di picco; se lo imposti su 0, la loro creazione viene impedita.
  • MAX_UNAVAILABLE: il numero massimo di nodi che possono non essere disponibili contemporaneamente durante il processo di aggiornamento. Aumentando questo valore, è possibile aggiornare più nodi contemporaneamente. Il valore predefinito è 0, ma può essere aumentato.

Controllare le impostazioni di aggiornamento controllato su un pool di nodi

Per visualizzare le impostazioni di aggiornamento controllato di un pool di nodi, esegui questo comando:

gcloud alpha container aws node-pools describe NODE_POOL_NAME
    --cluster CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION \

Sostituisci quanto segue:

  • NODE_POOL_NAME: il nome del tuo pool di nodi.
  • CLUSTER_NAME: il nome del cluster.
  • GOOGLE_CLOUD_LOCATION: la regione supportata Google Cloud che gestisce il cluster. Ad esempio: us-west1.

Se per il pool di nodi sono abilitati gli aggiornamenti di picco, l'output di questo comando mostra una sezione etichettata surge_settings. Questa sezione surge_settings mostra i valori dei parametri max_surge e max_unavailable.

Gestire gli aggiornamenti dei picchi in corso

Puoi annullare un aggiornamento dinamico in corso, eseguire il rollback di un aggiornamento dinamico non riuscito o riprendere un aggiornamento interrotto.

Annullare (mettere in pausa) e riprendere un aggiornamento del picco

In GKE su AWS, "annullare" un aggiornamento surge significa metterlo in pausa. Per informazioni dettagliate su come annullare un aggiornamento, vedi Annullare un'operazione di aggiornamento.

In altre parole, l'annullamento di un aggiornamento del picco non esegue il rollback dell'aggiornamento. Al contrario, potrebbe lasciare il pool di nodi in uno stato parzialmente aggiornato con due gruppi di scalabilità automatica: uno con i nodi che eseguono la configurazione precedente e uno con i nodi che eseguono la nuova configurazione. Per eliminare questo problema, riprendi l'aggiornamento eseguendo di nuovo il comando di aggiornamento, utilizzando gli stessi parametri di destinazione dell'operazione interrotta. L'avvio di un aggiornamento con parametri del pool di nodi diversi è limitato fino al termine dell'aggiornamento precedente.

Eseguire il rollback dell'aggiornamento di sovraccarico non riuscito

Puoi eseguire il rollback di un pool di nodi al suo stato originale se un aggiornamento di picco è stato annullato o non è andato a buon fine.

Aspetti da considerare prima di eseguire il rollback di un aggiornamento di picco

  • Puoi eseguire il rollback solo di un pool di nodi abilitato per l'aumento controllato che si trova in uno stato di aggiornamento parziale (o nello stato DEGRADED).
  • Una volta avviato il rollback su un pool di nodi, non puoi annullarlo.
  • Non puoi eseguire altre operazioni di aggiornamento finché l'operazione di rollback non viene completata correttamente.
  • Puoi riprovare un rollback solo se non va a buon fine.
  • Non puoi eseguire il rollback dei node pool dopo che sono stati aggiornati correttamente.

Come eseguire il rollback di un aggiornamento del picco non riuscito

Per eseguire il rollback di un'operazione di aggiornamento non riuscita sul pool di nodi, esegui questo comando:

gcloud container aws node-pools rollback NODE_POOL_NAME
    --cluster CLUSTER_NAME

Sostituisci quanto segue:

  • NODE_POOL_NAME: il nome del pool di nodi da aggiornare.
  • CLUSTER_NAME: il nome del cluster.

Come funziona il rollback

L'avvio di un rollback internamente avvia una nuova operazione di aggiornamento sul pool di nodi. "Internamente" significa che questa procedura viene eseguita all'interno del sistema stesso e non richiede il tuo intervento. L'operazione ripristina lo stato originale dei nodi del pool di nodi al meglio delle possibilità.

I nodi appartenenti al vecchio gruppo di scalabilità automatica vengono riattivati e il gestore della scalabilità automatica del cluster di questo gruppo è abilitato per consentire la pianificazione dei carichi di lavoro sui nodi. I nodi del pool di nodi aggiornati parzialmente nel nuovo gruppo di scalabilità automatica vengono isolati, svuotati e terminati in base alle impostazioni di picco che hai definito nel tentativo di aggiornamento iniziale del picco.

Gestire gli aggiornamenti dei prezzi dinamici non riusciti

Per risolvere il problema dell'aggiornamento non riuscito, hai tre opzioni:

  1. Continua l'aggiornamento: puoi procedere con l'aggiornamento non riuscito utilizzando le stesse impostazioni del pool di nodi di destinazione del tentativo iniziale non riuscito.
  2. Rollback: utilizza il comando rollback per ripristinare lo stato originale del pool di nodi.
  3. Modifica e riavvia: se vuoi modificare i parametri per l'aggiornamento di picco, ilpool di nodil esistente deve essere eliminato e poi ricreato con le nuove impostazioni. Per istruzioni su come eliminare un node pool, consulta Eliminare un node pool.