Casi d'uso
Questa architettura di riferimento per la disponibilità è adatta ai seguenti casi d'uso:
- Applicazioni business critical che richiedono RTO e RPO inferiori.
- Vuoi eseguire il deployment di una replica in un'altra zona o nodo che fornisca un'alta disponibilità per i tuoi database e protegga da errori a livello di istanza, server e zona.
- Vuoi proteggerti da errori dell'utente e danneggiamento dei dati (utilizzando i backup).
Come funziona l'architettura di riferimento
La disponibilità avanzata si aggiunge alla disponibilità standard aggiungendo istanze di repliche di lettura all'interno della regione per abilitare l'alta affidabilità (HA) che riduce il Recovery Time Objective (RTO). Questo approccio riduce anche il Recovery Point Objective (RPO) consentendo lo streaming delle modifiche transazionali alla replica.
L'alta affidabilità in AlloyDB Omni utilizza almeno due istanze di database. Un'istanza funge da database principale e supporta le operazioni di lettura e scrittura. Le istanze rimanenti fungono da repliche di lettura e operano in modalità di sola lettura.
Di seguito sono riportati i concetti importanti relativi all'alta disponibilità:
- Il failover è la procedura durante un'interruzione non pianificata in cui l'istanza principale non funziona o diventa non disponibile e la replica di standby viene attivata per assumere la modalità principale (lettura-scrittura). Questo processo è chiamato promozione. In genere, in questi scenari, quando il server o il database principale torna online, il database deve essere ricompilato e quindi deve fungere da standby. Per garantire un tempo di attività elevato, sono in atto meccanismi per rendere automatici i failover.
- Uno switchover, noto anche come inversione dei ruoli, è una procedura utilizzata per cambiare le modalità tra il database principale e uno dei database di standby, in modo che il database principale diventi di standby e il database di standby diventi principale. In genere, gli switchover avvengono in modo controllato e graduale e possono essere avviati per una serie di motivi, ad esempio per consentire tempi di inattività e applicazione di patch al database principale precedente. Gli switchover graduali devono consentire un futuro switchback senza dover reinizializzare il nuovo standby o altri aspetti della configurazione della replica.
Opzioni di alta affidabilità
Nei deployment non Kubernetes, utilizza Patroni e HAProxy. Per ulteriori informazioni, consulta Architettura di alta disponibilità per AlloyDB Omni per PostgreSQL.
| Nota: Patroni e HAProxy sono strumenti di terze parti non commerciali e sono compatibili con AlloyDB Omni. |
|---|
Ti consigliamo di avere almeno due database di standby in modo che la perdita di un database non influisca sull'alta affidabilità del cluster. In questa modalità, hai almeno una coppia di alta disponibilità in caso di failover o durante qualsiasi manutenzione pianificata di un nodo.
Per pianificare le dimensioni e la forma del deployment di AlloyDB Omni, consulta Pianificare l'installazione di AlloyDB Omni su una VM.
Bilanciatori del carico
Un altro meccanismo importante che facilita le procedure di switchover e failover è la presenza di un bilanciatore del carico.
Per i deployment non Kubernetes, il software HAProxy fornisce il bilanciamento del carico. HAProxy offre il bilanciamento del carico distribuendo il traffico di rete su più server. HAProxy mantiene anche lo stato di integrità dei server di backend a cui si connette eseguendo controlli di integrità. Se un server non supera un controllo di integrità, HAProxy smette di inviare traffico fino a quando non supera di nuovo i controlli di integrità.
Alta affidabilità
I database di repliche di lettura di cui è stato eseguito il deployment all'interno di una regione forniscono un'alta affidabilità se il database principale non funziona. Quando si verifica un errore del database principale, il database di standby viene promosso per sostituire il database principale e l'applicazione continua con un'interruzione minima o nulla.
In genere, è buona norma eseguire controlli regolari annuali o semestrali sotto forma di switchover per assicurarsi che tutte le applicazioni che si basano su questi database siano ancora in grado di connettersi e rispondere in un periodo di tempo adeguato.
La protezione a livello di zona può essere ottenuta utilizzando uno dei due tipi di deployment posizionando una delle repliche di lettura di standby in una zona di disponibilità diversa dal database principale.
Un ulteriore vantaggio di avere repliche di lettura è la possibilità di trasferire le operazioni di sola lettura sui database di standby, che possono fungere da database di reporting utilizzando dati aggiornati. Questo approccio riduce il carico e l'overhead sul database principale di lettura-scrittura.
Configurazione di backup e alta affidabilità
Le repliche di lettura possono essere configurate in più zone che forniscono un'alta affidabilità. Sebbene forniscano RTO e RPO bassi, non proteggono da determinate interruzioni, come il danneggiamento logico dei dati, ad esempio eliminazioni accidentali di tabelle o aggiornamenti errati dei dati. Pertanto, oltre alla configurazione dell'alta disponibilità, è necessario eseguire backup regolari. Per maggiori dettagli, consulta la documentazione sull'architettura di disponibilità standard.
La Figura 1 mostra una configurazione di alta disponibilità consigliata con due database di standby di repliche di lettura in due zone di disponibilità diverse.

Figura 1. AlloyDB Omni con opzioni di backup e alta affidabilità.
Per proteggerti dalla perdita di dati in caso di errore dell'istanza principale, è necessario configurare la replica in modalità sincrona. Sebbene questo metodo fornisca una protezione dei dati efficace, può influire sulle prestazioni del database principale perché tutti i commit devono essere scritti sia nel database principale sia in tutti i database di standby sincronizzati. Per questa configurazione è fondamentale una connessione di rete a bassa latenza tra queste istanze di database.
Deployment di alta disponibilità non Kubernetes
Il deployment non Kubernetes autonomo è una configurazione manuale che richiede strumenti di terze parti, la cui configurazione e manutenzione sono più complesse rispetto al deployment Kubernetes.
Quando utilizzi un deployment non Kubernetes, alcuni parametri influiscono sulla modalità di rilevamento di un failover e sulla rapidità con cui si verifica un failover dopo che il database principale diventa non disponibile. Di seguito è riportato un breve riepilogo di questi parametri:
Ttl: il tempo massimo necessario per acquisire un blocco per il database principale prima di avviare un failover. Il valore predefinito è 30 secondi.Loop_wait: il tempo di attesa prima di ricontrollare. Il valore predefinito è 10 secondi.Retry_timeout: il timeout prima di declassare l'istanza principale a causa di un errore di rete. Il valore predefinito è 10 secondi.
Per ulteriori informazioni, consulta Architettura di alta disponibilità per AlloyDB Omni per PostgreSQL.
Implementazione
Quando scegli un'architettura di riferimento per la disponibilità, tieni presente i seguenti vantaggi, limitazioni e alternative.
Vantaggi
- Protegge da errori dell'istanza.
- Protegge da errori del server.
- Protegge da errori della zona.
- L'RTO è notevolmente ridotto rispetto alla disponibilità standard.
Limitazioni
- Nessuna protezione aggiuntiva per i disastri regionali.
- Potenziale impatto sulle prestazioni del database principale a causa della replica sincrona.
- La configurazione dello streaming WAL di PostgreSQL in modalità sincrona offre una perdita di dati pari a zero (
RPO=0) durante il normale funzionamento o i failover tipici. Tuttavia, questo approccio non protegge dalla perdita di dati in situazioni specifiche di doppio errore, ad esempio quando tutte le istanze di standby vengono perse o diventano irraggiungibili dal database principale e questa situazione è immediatamente seguita da un riavvio del database principale.
Alternative
- L'architettura di disponibilità standard per le opzioni di backup e recupero.
- L'architettura di disponibilità Premium per il ripristino di emergenza a livello di regione, le repliche di lettura aggiuntive e la copertura estesa del ripristino di emergenza.
Passaggi successivi
- Panoramica dell'architettura di riferimento per la disponibilità di AlloyDB Omni.
- Disponibilità standard di AlloyDB Omni.
- Disponibilità premium di AlloyDB Omni.
- Pianificare l'installazione di AlloyDB Omni su una VM.
- Architettura di alta disponibilità per AlloyDB Omni per PostgreSQL.