Proteggere i dati con la replica zonale e regionale

Seleziona una versione della documentazione:

Questa pagina descrive l'architettura di riferimento per la disponibilità Premium di AlloyDB Omni, che include la protezione dei dati tramite la replica a livello di zona in una regione (alta affidabilità) e aggiunge la protezione di ripristino di emergenza (RE) tramite lo streaming asincrono su grandi confini geografici.

Questa architettura di riferimento è più adatta ai seguenti casi d'uso:

  • Oltre alla protezione a livello di zona, hai bisogno di una protezione a livello di regione per le applicazioni mission critical.

Questa architettura di riferimento per la disponibilità incorpora repliche di lettura all'interno della regione per l'alta disponibilità e tra le regioni per RE. Questo deployment multiregionale protegge da interruzioni significative, tra cui interruzioni di corrente diffuse e disastri naturali su larga scala.

Considerazioni sull'architettura di riferimento per la disponibilità

Quando valuti questa architettura di riferimento per la disponibilità, tieni presente i seguenti fattori:

  • Latenza e larghezza di banda della rete all'interno della regione e tra le regioni
  • Posizionamento geografico dei database e dei server delle applicazioni
  • Strategia per l'offload dei carichi di lavoro di sola lettura alle repliche
  • Eseguire il deployment dell'alta affidabilità nella regione di RE remota

Potrebbe essere necessario il bilanciamento del carico di sola lettura, soprattutto se utilizzi server delle applicazioni regionali, in modo che le richieste vengano inoltrate al database più vicino per una risposta più rapida. Per saperne di più, consulta Richiedere il routing a un bilanciatore del carico delle applicazioni classico multiregionale.

Potrebbe essere necessario un monitoraggio aggiuntivo per la replica tra regioni per assicurarsi che il ritardo di replica non inizi ad aumentare a causa del carico delle transazioni o della capacità di rete.

Per assicurarti che RE vada a buon fine, esegui test approfonditi di RE. È importante testare la funzionalità e la velocità effettiva dell'applicazione se sono presenti connessioni di rete ad alta latenza tra i server delle applicazioni e il database.

Architetture di alta disponibilità nella regione e di RE tra regioni

La Figura 1 mostra una configurazione di alta disponibilità e RE suggerita con tre database di standby di repliche di lettura in tre zone di disponibilità e due regioni.

AlloyDB Omni con opzioni di backup e alta affidabilità tra regioni

Figura 1. AlloyDB Omni con backup e opzioni di alta disponibilità tra regioni.

Come illustrato nella Figura 1, la replica di streaming sincrona alle repliche locali (all'interno della stessa regione) fornisce un'alta affidabilità, mentre la replica di streaming asincrona a una replica remota geograficamente separata fornisce la protezione di ripristino di emergenza a livello di regione. Nell'intera configurazione, solo l'istanza principale può eseguire operazioni di lettura/scrittura, mentre le altre repliche possono soddisfare le query di lettura.

Configura la replica dalla replica principale a quelle all'interno della regione in modalità sincrona, mentre la replica alle repliche tra regioni deve essere configurata in modalità asincrona per evitare che la latenza influisca sulle prestazioni di scrittura principali. In caso di errore a livello di regione, questa configurazione potrebbe comportare un RPO diverso da zero. Tuttavia, questa configurazione consente un RTO più rapido in caso di errore. Questo perché il database principale non deve attendere la conferma dai database di standby remoti prima di eseguire il commit delle transazioni.

È possibile eseguire backup aggiuntivi tra regioni dai database di repliche di lettura e quindi aggiungere ridondanza ai backup eseguiti dal database principale.

Backup delle repliche di lettura

Quando utilizzi i deployment di Kubernetes, il deployment secondario nella regione alternativa viene configurato automaticamente con backup aggiuntivi.

Considera quanto segue:

  • Se il backup remoto potrebbe essere soggetto a errori a livello di regione, devi avviare backup aggiuntivi nelle regioni alternative.
  • Se hai bisogno di ridondanza dei backup, devi eseguire backup delle repliche di lettura a livello di regione.

Posizione delle repliche di lettura per supportare la disponibilità multi-zona

L'operatore Kubernetes di AlloyDB Omni gestisce automaticamente il posizionamento dei nodi nelle zone e i nodi su cui devono essere sottoposti a deployment i pod. Alcune opzioni di configurazione che influiscono sul posizionamento, come l'affinità e la tolleranza dei pod, sono disponibili nella configurazione del database utilizzata per il deployment con l'operatore AlloyDB Omni.

Migrazione da un'architettura di sola alta disponibilità a un'architettura di alta disponibilità e RE

Per i deployment di Kubernetes, devi creare un nuovo deployment di Kubernetes regionale, chiamato cluster di database secondario, e abilitare la replica tra data center.

Implementazione

Quando scegli un'architettura di riferimento per la disponibilità, tieni presente i seguenti vantaggi, limitazioni e opzioni.

Vantaggi

  • Protegge da errori a livello di zona e di istanza
  • Protegge da errori a livello di regione
  • RTO ridotto quando il database riscontra un errore a livello di regione

Limitazioni

  • Puoi ridurre l'RPO per il recupero a livello di regione con la replica sincrona, ma questo approccio causa una latenza aggiuntiva per le prestazioni delle transazioni. Per la replica di disaster recovery e della regione remota, ti consigliamo di utilizzare solo la replica asincrona.
  • La configurazione dello streaming WAL di PostgreSQL in modalità sincrona offre una perdita di dati pari a zero (RPO=0) durante il normale funzionamento o i failover tipici. Tuttavia, questo approccio non protegge dalla perdita di dati in situazioni specifiche di doppio errore, ad esempio quando tutte le istanze di standby vengono perse o diventano irraggiungibili dalla replica principale e questa viene immediatamente seguita da un riavvio della replica principale.

Opzioni di protezione dei dati

Passaggi successivi