Modalità di sopravvivenza

I cluster Distributed Cloud connessi utilizzano un piano di controllo locale di cui viene eseguito il deployment sull'hardware Distributed Cloud connesso. Quando la connessione a Google Cloud viene persa, i cluster entrano in modalità di sopravvivenza e i workload continuano a essere eseguiti per un massimo di 7 giorni. Se un workload si interrompe mentre il cluster è in modalità di sopravvivenza, la memorizzazione nella cache locale delle immagini garantisce che il workload venga ripristinato quando la connessione Google Cloud viene ripristinata.

Un cluster può entrare in modalità di sopravvivenza a causa di un guasto hardware o software al di fuori del controllo di Google oppure a causa di un guasto nell'hardware o nel software di Distributed Cloud connesso.

Esempi di guasti al di fuori del controllo di Google:

  • Errore di connettività a internet nel sito di implementazione.
  • Configurazione errata del firewall o della rete o guasto hardware nel sito di deployment.
  • L'istanza proxy di confine che gestisce il cluster è stata ritirata o configurata in modo errato.

Se il cluster Distributed Cloud connected funziona in modalità di sopravvivenza per 7 giorni o meno a causa di un guasto hardware o software al di fuori del controllo di Google, l'assistenza Google collabora con te per ripristinarne il normale funzionamento fino al settimo giorno. Dopo 7 giorni, non è garantita ulteriore assistenza.

Esempi di guasti nell'hardware o nel software di Distributed Cloud connesso:

  • Un aggiornamento software di Distributed Cloud connesso difettoso.
  • Un errore nella macchina connessa a Distributed Cloud o nell'hardware di rete.
  • Un guasto non diagnosticato nel software Distributed Cloud connesso.

Se il cluster Distributed Cloud connesso entra in modalità di sopravvivenza a causa di un errore nel software o nell'hardware Distributed Cloud connesso, l'assistenza Google collabora con te finché il cluster non viene ripristinato al normale funzionamento.

Cosa succede quando un cluster entra in modalità di sopravvivenza

Quando un cluster Distributed Cloud connected entra in modalità di sopravvivenza, si verifica quanto segue:

  • Google ti invia una notifica via email per comunicarti che il cluster interessato è entrato in modalità di sopravvivenza. L'email viene inviata alla categoria tecnica dei contatti essenziali specificati nel Google Cloud progetto corrispondente.
  • Se hai bisogno di assistenza per ripristinare il normale funzionamento del cluster, contatta l'Assistenza Google.

Funzionamento del cluster in modalità di sopravvivenza

Quando è attiva la modalità di sopravvivenza, un cluster Distributed Cloud connesso funziona nel seguente modo:

  • Quando la connessione a Google Cloud viene persa, Distributed Cloud connected tenta continuamente di riconnettersi a Google Cloud finché la connessione non viene ristabilita.
  • Il controllo dei carichi di lavoro tramite Google Cloud CLI, l'interfaccia a riga di comando kubectl e l'API Distributed Cloud Edge Container è disattivato. Tuttavia, puoi generare credenziali offline per accedere ai tuoi cluster tramite una connessione a internet alternativa, come descritto in Ottenere le credenziali per un cluster.
  • Gli aggiornamenti software, gli SLO e la riparazione dell'hardware di Distributed Cloud non sono disponibili.
  • Log e metriche limitati vengono sincronizzati con Google Cloud dopo che la connessione a Google Cloud è stata ristabilita:
    • Le metriche di sistema sono limitate a 6 GB o 22 ore, a seconda di quale limite viene raggiunto per primo.
    • I log del workload sono limitati a 4 ore.
    • Le metriche dei carichi di lavoro sono limitate a 1 GB.
    • I log di controllo sono limitati a 10 GB.
  • Per impostazione predefinita, se un nodo viene riavviato mentre il cluster è disconnesso da Google Cloud, non può ricongiungersi al cluster finché la connessione a Google Cloud non viene ristabilita perché la chiave di autenticazione non può essere aggiornata. Hai la possibilità di specificare una finestra di riavvio offline durante la quale un nodo può rientrare in un cluster dopo il riavvio mentre il cluster è in esecuzione in modalità di sopravvivenza. Per ulteriori informazioni, vedi Creare un cluster.

Cosa fare quando un cluster esce dalla modalità di sopravvivenza

Quando un cluster Distributed Cloud connected esce dalla modalità di sopravvivenza, controlla quanto segue:

  • Versione del software Distributed Cloud connesso. Potresti dover aggiornare il cluster interessato all'ultima versione del software Distributed Cloud connesso, a meno che tu non abbia bloccato deliberatamente il cluster a una versione software specifica. Per saperne di più, vedi Eseguire l'upgrade della versione software di un cluster.
  • Certificati di gestione del parco risorse. Potresti dover aggiornare i certificati LOAS di gestione della flotta scaduti. Per risolvere il problema, contatta l'Assistenza Google.

Controllare lo stato della connessione di un cluster

Puoi controllare lo stato del cluster Distributed Cloud per Google Cloud completando i passaggi descritti in Ottenere informazioni su un cluster. Il comando restituisce il valore del campo connectionState. Questo campo può contenere uno dei seguenti valori:

  • CONNECTED: il cluster è connesso e completamente sincronizzato con Google Cloud.
  • DISCONNECTED: il cluster non è connesso a Google Cloud.
  • CONNECTED_AND_SYNCING: il cluster si è riconnesso a Google Cloud e sta sincronizzando i dati offline con Google Cloud. Non scollegare questo cluster da Google Cloud fino al termine della sincronizzazione.

Passaggi successivi