Per garantire la continuità operativa e ridurre al minimo la perdita di dati, l'alta affidabilità (HA) e ripristino di emergenza (RE) sono strategie di protezione dei dati fondamentali per AlloyDB Omni. L'alta disponibilità si concentra sul mantenimento della disponibilità del database e sulla riduzione al minimo del Recovery Time Objective (RTO), mentre RE ripristino di emergenza si occupa del ripristino da eventi catastrofici e della riduzione al minimo del Recovery Point Objective (RPO).
RTO e RPO sono allineati ai requisiti aziendali e sono definiti come segue:
- RTO è il tempo massimo in cui un database può essere inattivo o non disponibile prima che l' attività subisca conseguenze inaccettabili, come la perdita di entrate o produttività.
- RPO è la quantità massima di perdita di dati che un'attività può subire prima che influisca sui requisiti aziendali. Ad esempio, i sistemi di inventario che richiedono una traccia di audit completa potrebbero avere un requisito di perdita di dati pari a zero.
AlloyDB Omni offre le seguenti architetture di riferimento per la disponibilità che forniscono livelli di disponibilità crescenti:
- Disponibilità standard: protegge i dati utilizzando i backup.
- Disponibilità avanzata: protegge i dati utilizzando la replica a livello di zona in una regione (alta disponibilità).
- Disponibilità premium: protegge i dati utilizzando la replica a livello di zona e di regione (alta disponibilità e RE).
Meccanismi di disponibilità
Di seguito sono riportati i principali meccanismi che garantiscono la disponibilità:
- Backup dei database
- Replica dei database
Backup dei database
I backup dei database, un aspetto fondamentale della protezione dei dati, comportano la creazione di copie fisiche dei file di dati del database. I diversi tipi di backup (completo, incrementale e differenziale) offrono diversi compromessi tra Recovery Point Objective (RPO), dimensioni e durata del backup e tempo di ripristino.
Per garantire un ripristino efficiente e ridurre al minimo la perdita di dati in caso di guasti del sistema, una strategia di backup efficace deve includere sia i backup del database sia i backup dei file di log WAL (Write-Ahead Log). I backup regolari (in genere giornalieri) dei file di dati sono fondamentali. Devi anche eseguire il backup dei file WAL, che registrano le modifiche del database e sono fondamentali per il recupero point-in-time e per mantenere l'integrità dei dati durante il ripristino.
Replica dei database
PostgreSQL offre server di replica per una maggiore affidabilità. Queste repliche sono classificate come standby warm, che non accettano connessioni di applicazioni, o standby hot, che operano in modalità di sola lettura. Le modifiche del database principale vengono applicate continuamente alla replica per mantenere aggiornati i dati della replica. Se il database principale non funziona, la replica viene promossa allo stato principale e assume le responsabilità del database principale.
Le repliche del database possono essere inserite nella stessa zona o nello stesso data center dell'istanza principale, in una zona diversa, in una regione diversa o in un mix di queste località. Più la replica è lontana dal database principale, maggiore è la latenza durante l'invio delle modifiche per mantenere aggiornate le repliche. Per le implementazioni in località distanti per mitigare i guasti su larga scala, come i guasti regionali, la replica dei dati viene in genere eseguita in modo asincrono. Questo approccio evita il degrado delle prestazioni che può verificarsi in queste configurazioni.
Nelle implementazioni ad alta affidabilità, le repliche vengono in genere implementate in prossimità del database principale. Ad esempio, le repliche implementate in una zona diversa all'interno dello stesso data center offrono RTO bassi e RPO quasi pari a zero. D'altra parte, nelle configurazioni di ripristino di emergenza, le repliche vengono eseguite il deployment in data center o regioni separati, a seconda del livello di protezione richiesto contro le interruzioni. Questo approccio comporta un RPO più elevato (poiché la replica potrebbe essere asincrona) e un RTO variabile.
La tabella seguente riepiloga i meccanismi utilizzati per le architetture di riferimento per la disponibilità di AlloyDB Omni:
| Funzionalità | Standard | Avanzata | Premium |
|---|---|---|---|
| Backup | ✔ | ✔ | ✔ |
| Replica a livello di zona | ❌ | ✔ | ✔ |
| Replica tra zone | ❌ | ✔ | ✔ |
| Replica regionale | ❌ | ❌ | ✔ |
Tabella 1. Meccanismi di disponibilità di AlloyDB Omni supportati
Scenari di guasto e ripristino del database
Il guasto del database può verificarsi ai seguenti livelli:
- Guasto dell'istanza (nodo o server): il database stesso non funziona.
- Guasto del server: il server che ospita il database non funziona.
- Guasto a livello di zona: l'intero data center che ospita il server non funziona.
- Guasto a livello di regione: l'intera regione contenente più data center (zone di disponibilità) non è disponibile, ad esempio a causa di un'inondazione o di un terremoto di grande magnitudo.
La probabilità e il rischio di un disastro diminuiscono quando si verificano meno eventi e il costo della prevenzione di questi eventi aumenta. Le aziende devono determinare la propria tolleranza al rischio e scegliere se accettare potenziali interruzioni o investire in architetture più resilienti per ridurre al minimo i rischi.
La tabella seguente riepiloga gli scenari di ripristino supportati dalle architetture di riferimento di AlloyDB Omni:
| Tipo di disastro | Standard | Avanzata | Premium |
|---|---|---|---|
| Guasto della VM/dell'istanza | ✔ | ✔ | ✔ |
| Guasto del nodo/server | ✔ | ✔ | ✔ |
| Guasto a livello di zona | ❌ | ✔ | ✔ |
| Guasto a livello di regione | ❌ | ❌ | ✔ |
Tabella 2. Scenari di ripristino supportati
Considera gli obiettivi aziendali per il tuo database AlloyDB Omni, ad esempio la necessità critica di diversi 9 (99,99%) di disponibilità e di perdita di dati pari a zero al momento del ripristino per le applicazioni mission-critical. L'obiettivo delle architetture di riferimento per la disponibilità è soddisfare i requisiti di RTO e RPO (Recovery Point Objective).
AlloyDB Omni offre architetture di disponibilità standard, avanzate e premium per proteggere i database da interruzioni pianificate e non pianificate, in linea con le diverse esigenze aziendali. Ad esempio, gli ambienti di sviluppo potrebbero utilizzare la protezione di base con i backup, mentre le applicazioni mission-critical potrebbero utilizzare configurazioni di alta affidabilità e ripristino di emergenza.
Passaggi successivi
Scopri di più sulle architetture di riferimento per la disponibilità di AlloyDB Omni:
- Proteggi i dati utilizzando i backup (disponibilità standard).
- Proteggi i dati utilizzando la replica a livello di zona in una regione (disponibilità avanzata).
- Proteggi i dati utilizzando la replica a livello di zona e di regione (disponibilità premium).