Best practice per la disponibilità

Questa pagina descrive le best practice per garantire l'alta disponibilità per l'installazione di Google Distributed Cloud. Distributed Cloud non offre un accordo sul livello del servizio (SLA) e fornisce solo l'obiettivo del livello del servizio (SLO) descritto in questa pagina.

Scegliere e implementare il livello di disponibilità

Devi scegliere il livello di disponibilità per i tuoi workload Distributed Cloud più adatto ai requisiti della tua attività. Ad esempio, un'applicazione di self-checkout in un negozio al dettaglio ha un rischio di disponibilità molto inferiore rispetto a un deployment RAN edge di un operatore di rete mobile.

La disponibilità del target è direttamente proporzionale alla capacità di risorse di riserva di Distributed Cloud che prenoti per le emergenze. La tabella seguente descrive questa relazione. Queste stime non includono il tempo di inattività pianificato con un periodo di manutenzione.

Il software Distributed Cloud connected consuma alcune risorse su ogni macchina fisica. L'importo varia a seconda della configurazione specifica del deployment connesso a Distributed Cloud. Google consiglia di eseguire il benchmark del deployment di Distributed Cloud connected per misurare questo importo e tenerne conto quando pianifichi la distribuzione del carico di lavoro.

Capacità in uso Capacità riservata Disponibilità del target
83,33% 16,67% 99,9%
100% 0% 93,5%

Potresti riscontrare un'improvvisa perdita di capacità a causa di un guasto hardware o di un nodo che richiede un riavvio. Per prepararti a questo, devi progettare i tuoi workload tenendo conto delle quote di risorse, in modo da avere sempre capacità disponibile su ogni nodo Distributed Cloud che soddisfi il livello di disponibilità scelto.

Ad esempio, per raggiungere una disponibilità target del 99,9%, devi configurare i tuoi workload in modo che una delle sei macchine fisiche in ogni cluster Distributed Cloud sia disponibile come backup.

Utilizzare la modalità di sopravvivenza

Distributed Cloud ti consente di creare cluster che utilizzano un control plane locale eseguito sull'hardware Distributed Cloud. Questi cluster consentono ai workload di continuare a essere eseguiti quando la connessione a Google Cloud viene persa. Per saperne di più, consulta la modalità di sopravvivenza di Distributed Cloud.

Informazioni su aggiornamenti software e periodi di manutenzione

Google aggiorna regolarmente il software Distributed Cloud. Questi aggiornamenti software sono obbligatori e non puoi disattivarli. Distributed Cloud ti consente di specificare finestre di manutenzione individuali per ciascuno dei tuoi cluster Distributed Cloud.

Per ridurre le potenziali interruzioni temporanee dei carichi di lavoro, i periodi di manutenzione ti consentono di controllare quando possono avvenire gli upgrade automatici dei control plane e dei nodi. I periodi di manutenzione sono utili per i seguenti tipi di scenari, tra gli altri:

  • Ore non di punta: vuoi ridurre al minimo la possibilità di tempi di inattività pianificando gli upgrade automatici durante le ore non di punta, quando il traffico è ridotto.
  • Su richiesta:vuoi assicurarti che gli upgrade vengano eseguiti durante l'orario di lavoro in modo che qualcuno possa monitorarli e gestire eventuali problemi imprevisti.
  • Upgrade multi-cluster:vuoi eseguire il rollout degli upgrade su più cluster in diverse regioni uno alla volta a intervalli specificati.

Oltre agli upgrade automatici, Google potrebbe occasionalmente dover eseguire altre attività di manutenzione. In questi casi, rispetta la periodo di manutenzione di un cluster, se possibile.

Se le attività vengono eseguite oltre il periodo di manutenzione, Distributed Cloud tenta di metterle in pausa. Poi tenta di riprendere queste attività durante il periodo di manutenzione successivo.

Distributed Cloud si riserva il diritto di implementare upgrade di emergenza non pianificati al di fuori dei periodi di manutenzione. Inoltre, gli upgrade obbligatori di software ritirati o obsoleti potrebbero essere eseguiti automaticamente al di fuori dei periodi di manutenzione.

Puoi anche eseguire l'upgrade manuale del cluster in qualsiasi momento. Gli upgrade avviati manualmente iniziano immediatamente e ignorano eventuali finestre di manutenzione.

Per scoprire come configurare un periodo di manutenzione per un cluster nuovo o esistente, consulta Configurare un periodo di manutenzione.

Limitazioni

I periodi di manutenzione presentano le seguenti limitazioni:

  • Un periodo di manutenzione per cluster. Puoi configurare una sola periodo di manutenzionee per cluster. La configurazione di un nuovo periodo di manutenzione sovrascrive quello precedente.

  • Fusi orari per i periodi di manutenzione. Quando configuri e visualizzi le finestre di manutenzione, gli orari vengono visualizzati in modo diverso a seconda dello strumento che utilizzi, come descritto nelle sezioni seguenti.

Quando configuri i periodi di manutenzione

Quando utilizzi il flag più generico --maintenance-window per configurare una periodo di manutenzione, non puoi specificare un fuso orario. Quando utilizzi Google Cloud CLI o l'API, l'ora UTC viene utilizzata per visualizzare gli orari. La consoleGoogle Cloud utilizza il fuso orario locale per visualizzare gli orari.

Quando utilizzi flag più granulari, come --maintenance-window-start, puoi specificare il fuso orario come parte del valore. Se ometti il fuso orario, viene utilizzato il fuso orario locale. Gli orari vengono sempre memorizzati nel fuso orario UTC.

Quando visualizzi i periodi di manutenzione

Quando visualizzi le informazioni sul tuo cluster, i timestamp per le finestre di manutenzione possono essere visualizzati in formato UTC o nel tuo fuso orario locale, a seconda di come visualizzi le informazioni:

  • Quando utilizzi la console Google Cloud per visualizzare le informazioni sul tuo cluster, gli orari vengono sempre visualizzati nel tuo fuso orario locale.
  • Quando utilizzi gcloud CLI per visualizzare le informazioni sul tuo cluster, gli orari vengono sempre visualizzati in formato UTC.

In entrambi i casi, RRULE è sempre nel fuso orario UTC. Ciò significa che, se specifichi, ad esempio, i giorni della settimana, questi sono nel fuso orario UTC.

Configura periodi di manutenzione del cluster

Distributed Cloud ti consente di specificare una periodo di manutenzione per ciascuno dei tuoi cluster Distributed Cloud. Questa finestra indica a Google di aggiornare il software Distributed Cloud solo durante il periodo e alla frequenza specificati.

Le seguenti regole regolano i periodi di manutenzione del cluster Distributed Cloud:

  • Se specifichi un periodo di manutenzione per un cluster Distributed Cloud, Google aggiorna il software Distributed Cloud 48 ore dopo l'annuncio dell'aggiornamento tramite le note di rilascio di Distributed Cloud. Nella pagina delle note di rilascio, puoi iscriverti al feed RSS delle note di rilascio di Distributed Cloud per ricevere informazioni sugli aggiornamenti software man mano che vengono rilasciati.
  • La durata minima di un periodo di manutenzione è di sei ore. Puoi specificare una finestra più lunga in base alla complessità dell'installazione di Distributed Cloud e ai requisiti della tua attività.
  • La frequenza minima degli aggiornamenti software è una volta alla settimana. Puoi specificare periodi di manutenzione settimanali o giornalieri. Puoi includere ed escludere giorni specifici.
  • Puoi modificare la pianificazione del periodo di manutenzione per un cluster in qualsiasi momento, tranne quando è già stato pianificato un periodo di manutenzione o quando un periodo di manutenzione è in corso.
  • Se l'aggiornamento software non viene completato entro il periodo di tempo specificato, viene messo in pausa e riprende durante il successivo periodo di manutenzione pianificato.

Per istruzioni dettagliate, vedi Configurare una periodo di manutenzione per un cluster.

Riparazione dell'hardware non riuscito

Quando Google rileva un errore dell'hardware Distributed Cloud, tenta di pianificare una visita al sito entro tre giorni lavorativi. Affinché un tecnico autorizzato da Google esegua la diagnosi e le riparazioni necessarie, devi concedergli l'accesso all'hardware Distributed Cloud.

Se si verifica un guasto dell'hardware Distributed Cloud e Google esegue riparazioni in loco, tutti i supporti di archiviazione vengono rimossi dalla macchina Distributed Cloud in manutenzione e vengono affidati alla tua custodia per la durata della riparazione.

Altri punti di errore

Sei responsabile della manutenzione dei seguenti aspetti dell'installazione di Distributed Cloud che non sono sotto il controllo di Google e possono influire sulla disponibilità di Distributed Cloud:

Passaggi successivi