Responsabilità condivisa di Google Distributed Cloud connesso

Il monitoraggio e la manutenzione di Google Distributed Cloud connected sono una responsabilità condivisa tra Google e il cliente. Utilizza le informazioni contenute in questo documento per determinare il modo migliore per eseguire il deployment e gestire i carichi di lavoro on-premise.

Responsabilità di Google

In qualità di servizio hardware e software gestito, Google è responsabile della gestione e del monitoraggio dell'infrastruttura che utilizzi per il deployment delle applicazioni aziendali.

Google è responsabile dei seguenti aspetti del sistema Distributed Cloud connesso:

  • Il Google Cloud control plane
  • Il piano di controllo Kubernetes, il nodo worker e i servizi di sistema integrati
  • Componenti aggiuntivi e prodotti software forniti da Google
  • Hardware fornito, inclusi i server

Google monitora la funzionalità di cui è responsabile e avvisa i tecnici di Google quando vengono rilevati problemi, in modo che possano indagare.

Responsabilità del cliente

Sei responsabile dei seguenti aspetti del sistema Distributed Cloud connesso:

  • La rete locale, inclusi eventuali switch forniti dal cliente
  • Connettività internet
  • Alimentazione
  • L'ambiente, ad esempio il raffreddamento
  • Applicazione del cliente e qualsiasi componente aggiuntivo Google Distributed Cloud o Kubernetes installato dal cliente
  • Deployment di istanze bastion host e proxy di confine di proprietà del cliente, se utilizzi queste funzionalità

Google non monitora direttamente i problemi di tua responsabilità. Ad esempio, Google non monitora se una VM cliente non si avvia correttamente o se l'applicazione del cliente non è in esecuzione. Se ritieni che questi comportamenti siano dovuti a un problema della piattaforma, devi aprire un ticket di assistenza Google Cloud affinché Google possa eseguire un'indagine.

Responsabilità condivisa

In alcuni casi, Google rileva un errore del sito, ma ritiene che la causa sia un problema specifico del sito di cui sei responsabile. Ad esempio, potremmo notare un aumento delle temperature nel tempo in tutti i nodi di un sito, seguito da una disconnessione, il che indica che il problema è probabilmente un guasto del sistema di raffreddamento locale. In questi scenari, Google avvia la risoluzione collaborativa dei problemi con te per confermare se il problema è causato da responsabilità specifiche del cliente del sito e per verificare eventuali guasti hardware.

Per risolvere correttamente i problemi e determinare la causa principale, Google potrebbe dover richiedere e ricevere informazioni da te. Ad esempio, Google potrebbe aver bisogno di sapere l'ora dell'interruzione di corrente e quando l'alimentazione o la rete vengono ripristinate. Se non riesci a fornire queste informazioni, Google potrebbe non essere in grado di eseguire un'analisi dettagliata della causa principale.

Errori di connettività

Nel caso specifico di un errore di connettività a internet, il prodotto supporta la modalità di sopravvivenza per un massimo di sette giorni. Durante questo periodo, è disponibile l'accesso locale al servizio. Tuttavia, Google non può monitorare, mitigare o diagnosticare i problemi del sistema in loco finché non viene ripristinata la connettività di rete.

Sebbene Google monitori le disconnessioni dei siti dai sistemi di telemetria di Google, non possiamo determinare da remoto se la causa principale sia l'alimentazione, la connettività ISP o un guasto catastrofico del sito, come un incendio o un'alluvione.

Se tutto l'hardware di un sito smette di inviare dati contemporaneamente, la causa probabile è un problema di alimentazione o di rete locale. Per evitare falsi allarmi, Google potrebbe non comunicare il problema finché non avremo la conferma che non si risolverà autonomamente, ad esempio a causa della manutenzione dell'ISP, e che non può essere risolto virtualmente. In questo caso, sono necessari ulteriori passaggi per la risoluzione dei problemi.

Se configurato per bastion host e il proxy di confine (BH/BP), Google monitora la connettività utilizzando i tuoi BH/BP e i dispositivi connessi a Distributed Cloud tramite BH/BP utilizzando richieste di test periodiche. Google si aspetta che tu monitori l'integrità complessiva delle istanze BH/BP, ad esempio monitorando l'utilizzo delle risorse. Se rileviamo problemi di connettività con BH/BP o con i dispositivi connessi a Distributed Cloud e sospettiamo che il problema possa avere origine dai componenti di proprietà del cliente, potremmo chiederti di diagnosticare ed eseguire il debug del problema.

Debug

Per facilitare il debug, Google potrebbe richiedere i seguenti dati:

  • Qualsiasi modifica alla configurazione applicata ad apparecchiature di rete non gestite da Google, come switch, router o firewall, incluso il timestamp al secondo più vicino
  • Log di negazione del firewall, inclusi timestamp e dettagli
  • L'ora e i motivi di eventuali riavvii del dispositivo. I motivi potrebbero includere un aggiornamento software, un'interruzione di corrente o un errore software.
  • L'ora di eventuali interruzioni di corrente, che potrebbero essere note, ad esempio dalla gestione dell'edificio o del data center, o dedotte dall'ultimo messaggio di log di altre apparecchiature
  • L'ora di eventuali interruzioni di rete, in base al provider di rete o ai messaggi di log sul router o sul firewall

Per problemi di interoperabilità, Google potrebbe anche richiedere il debug congiunto con un fornitore, inclusa la condivisione dei file di log del dispositivo e l'attivazione delle opzioni di debug. Quando possibile, cerchiamo di riprodurre il problema in un ambiente di laboratorio del cliente.

In alcuni casi, Google può ottenere informazioni dalle nostre apparecchiature gestite, ma potrebbero essere incomplete. Ad esempio, dopo un'interruzione di corrente, l'avvio della connessione ISP può richiedere più tempo rispetto ai server connessi a Distributed Cloud.

Divisione delle responsabilità

Utilizza la seguente tabella per determinare chi è responsabile delle attività comuni.

Attività Cliente Google
Identifica i problemi di disconnessione del deployment e fornisci ai clienti notifiche per l'indagine X
Risolvere i problemi di alimentazione X
Risolvi i problemi di rete, inclusi gli switch forniti dai clienti. X X
Risolvere problemi ambientali, ad esempio il raffreddamento X
Risolvi le istanze bastion host di proprietà del cliente e i deployment del proxy di confine, se implementati X
Monitora il piano di gestione delle API X
Monitorare il control plane Kubernetes, il nodo worker e i servizi di sistema integrati X
Monitora i componenti aggiuntivi e i prodotti software forniti da Google, ad esempio Symcloud Storage X
Monitorare l'hardware fornito, come i server e, per alcuni deployment, le apparecchiature di rete X
Monitorare le apparecchiature di rete fornite dal cliente X
Monitorare la connettività di rete upstream X
Fornire assistenza con il debug congiunto per problemi di rete o ambientali X
Osservabilità della piattaforma, incluse metriche e log X
Osservabilità delle applicazioni, incluse metriche e log X
Rispondere alle richieste di indagine su problemi che si ritiene siano di responsabilità del cliente X