Il monitoraggio e la manutenzione di Google Distributed Cloud connected sono una responsabilità condivisa fra te e Google. Questa pagina delinea queste responsabilità.
Panoramica
La seguente tabella riepiloga le responsabilità per le attività di gestione connesse a Distributed Cloud.
| Problema | Tu | |
|---|---|---|
| Rilevare e notificarti la disconnessione da Google Cloud | X | |
| Rilevare e risolvere problemi di alimentazione, raffreddamento e ambiente | X | |
| Rilevare e risolvere i problemi della rete locale | X | X |
| Identifica e risolvi i problemi relativi alle istanze di bastion host e proxy di confine | X | |
| Monitora il Google Cloud control plane | X | |
| Monitorare i piani di controllo Kubernetes, i nodi worker e i servizi di sistema | X | |
| Monitorare soluzioni di terze parti fornite da Google, come Symcloud Storage | X | |
| Monitorare e risolvere i problemi relativi all'hardware acquistato direttamente da Google | X | |
| Monitorare e risolvere i problemi relativi all'hardware acquistato da un integratore di sistemi di terze parti certificato da Google | X | |
| Monitorare e risolvere i problemi della rete locale | X | |
| Monitorare la connettività di rete upstream | X | |
| Partecipare alla diagnosi congiunta di problemi di rete, alimentazione o raffreddamento | X | |
| Osservabilità della piattaforma, incluse metriche e log | X | |
| Osservabilità delle applicazioni, incluse metriche e log | X | |
| Diagnosticare e risolvere i problemi che rientrano nelle tue responsabilità | X |
Responsabilità di Google
Google è responsabile dei seguenti aspetti del deployment di Distributed Cloud connected:
- L'hardware Distributed Cloud connesso che hai acquistato direttamente da Google; non siamo responsabili dell'hardware che hai acquistato da un integratore di sistemi (SI) di terze parti partner di Google
- Il Google Cloud control plane
- I control plane Kubernetes, i nodi worker e i servizi di sistema integrati in esecuzione sull'hardware connesso a Distributed Cloud
- Componenti aggiuntivi e prodotti software forniti da Google
Google monitora costantemente l'integrità e le prestazioni di questi aspetti; se rileviamo un problema, ti inviamo una notifica e adottiamo misure correttive.
Le tue responsabilità
Sei responsabile dei seguenti aspetti del deployment di Distributed Cloud connected:
- Hardware Distributed Cloud connesso che hai acquistato da un integratore di sistemi (SI) di terze parti certificato da Google; non sei responsabile dell'hardware acquistato direttamente da Google
- La tua rete locale e la sua configurazione
- La tua connettività internet
- Alimentazione, raffreddamento, temperatura ambiente e umidità nel sito di implementazione
- Soluzioni software di terze parti installate nel deployment connesso di Distributed Cloud
- Le istanze del bastion host e le implementazioni del proxy di confine, se applicabile
- I tuoi carichi di lavoro
Google non monitora questi aspetti né ti avvisa di eventuali problemi che si presentano. Se ritieni che un problema del workload sia causato da Distributed Cloud Connected, contatta l'assistenza Google.
Responsabilità condivise
In alcuni casi, Google potrebbe rilevare un problema che riteniamo rientri nella tua responsabilità. Ad esempio, potremmo rilevare un aumento delle temperature all'interno dell'hardware Distributed Cloud connected, seguito dalla perdita di connettività a Google Cloud, il che potrebbe indicare un guasto del sistema di raffreddamento. In queste situazioni, Google ti contatta per risolvere il problema in collaborazione. Potremmo aver bisogno di ulteriori informazioni sull'incidente per diagnosticarlo correttamente; se non riesci a fornire queste informazioni, la risoluzione potrebbe essere difficile.
Errori di connettività
Quando la connessione a Google Cloud viene persa, i cluster entrano in modalità di sopravvivenza e i workload continuano a essere eseguiti per un massimo di 7 giorni. Google non può monitorare, diagnosticare né risolvere i problemi finché non ripristini questa connessione. Non possiamo aiutarti a determinare la causa della disconnessione.
Se notiamo che l'intero deployment connesso a Distributed Cloud è andato offline contemporaneamente, potremmo non inviarti una notifica finché non avremo confermato che il problema non può essere risolto autonomamente. Ad esempio, un'interruzione dell'ISP nel sito di deployment potrebbe risolversi autonomamente entro un periodo di tempo ragionevole.
Deployment di bastion host e proxy di confine
Se hai configurato un'istanza bastion host o un'istanza proxy di confine nel tuo deployment connesso a Distributed Cloud, Google monitora la connettività a queste istanze. Se rileviamo un problema che riteniamo possa essere causato dalla tua rete locale, potremmo chiederti di risolverlo per ripristinare il corretto funzionamento.
Informazioni necessarie per la diagnosi
Per diagnosticare i problemi che rileviamo con la tua implementazione di Distributed Cloud connected, potremmo chiederti le seguenti informazioni:
- Eventuali modifiche alla configurazione apportate alla rete locale, ad esempio switch, router e firewall, con timestamp accurati al secondo
- Log di negazione del firewall, con timestamp accurati al secondo
- Motivi e orari esatti dei riavvii o dei cicli di accensione del dispositivo, ad esempio aggiornamenti di software o firmware, arresti anomali e altri errori
- Orari esatti di eventuali interruzioni dell'alimentazione
- Orari esatti di eventuali interruzioni della rete locale, con timestamp accurati al secondo dai log del router o del firewall
Problemi di interoperabilità di terze parti
Per i problemi di interoperabilità con soluzioni di terze parti, potremmo coinvolgere il fornitore corrispondente per diagnosticarli; ciò potrebbe includere la condivisione dei file di log e la configurazione delle opzioni di diagnostica. Se disponibile, proviamo a riprodurre il problema nel tuo ambiente lab.