Eseguire test di failover per ambienti a elevata resilienza

Managed Airflow (terza generazione) | Managed Airflow (seconda generazione) | Managed Airflow (prima generazione legacy)

Questa pagina descrive come eseguire un test di failover del database per ambienti a elevata resilienza (ad alta disponibilità).

I test di failover per il tuo ambiente simulano un'interruzione completa di una zona in un data center. In questo scenario, potrebbe verificarsi un'interruzione zonale di un database. Eseguendo un test di failover, puoi monitorare il modo in cui il tuo ambiente a elevata resilienza esegue un failover e verificare in che modo influisce su DAG e attività.

Prima di iniziare

  • Per eseguire i test di failover, il tuo Account Google deve disporre dei seguenti ruoli e autorizzazioni:

  • In Managed Airflow (terza generazione), il cluster dell'ambiente si trova nel progetto tenant dell'ambiente e non è possibile simulare un'interruzione zonale.

Controlla che l'ambiente sia integro

Assicurati di eseguire i test di failover solo su ambienti integri. Per verificare che l'ambiente sia integro:

  1. Nella Google Cloud console, vai alla pagina Ambienti.

    Vai ad Ambienti

  2. Nell'elenco degli ambienti, fai clic sul nome del tuo ambiente. Si apre la pagina Dettagli ambiente.

  3. Vai alla scheda Monitoraggio.

  4. Assicurati che tutte le metriche di integrità siano verdi.

Esegui un test di failover del database

Puoi eseguire un test di failover del database, che simula un'interruzione zonale, attivandolo con un comando Google Cloud CLI. Ad esempio, potresti volerlo fare per misurare la quantità di tempo necessaria al database del tuo ambiente per passare a un'altra zona.

Per eseguire un test di failover del database per il tuo ambiente:

  1. Assicurati che l'ambiente sia integro.

  2. Recupera la zona principale del database del tuo ambiente:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    Sostituisci quanto segue:

    • ENVIRONMENT_NAME: il nome del tuo ambiente Cloud Composer.
    • LOCATION: la regione in cui si trova l'ambiente.

    Esempio:

    gcloud composer environments fetch-database-properties \
        example-environment \
        --location us-central1
    
  3. Avvia il test di failover del database:

    gcloud composer environments database-failover \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    Sostituisci quanto segue:

    • ENVIRONMENT_NAME: il nome del tuo ambiente Cloud Composer.
    • LOCATION: la regione in cui si trova l'ambiente.

    Esempio:

    gcloud composer environments database-failover \
        example-environment \
        --location us-central1
    
  4. Attendi il completamento del test di failover del database. La procedura può richiedere fino a 3 minuti.

  5. Verifica che la zona principale del database del tuo ambiente sia stata modificata:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    
  6. Controlla le metriche di integrità dell'ambiente per assicurarti che sia integro.

  7. Il database dell'ambiente diventa pronto per un altro failover quando la metrica dell'ambiente Database disponibile per il failover (composer.googleapis.com/environment/database/available_for_failover) diventa True. Per ulteriori informazioni sulla visualizzazione delle metriche dell'ambiente in Cloud Monitoring, consulta Monitorare gli ambienti.

Passaggi successivi