Questa pagina descrive come comprendere l'integrità delle applicazioni e mantenerne la disponibilità e l'affidabilità.
Funzionalità di osservabilità predefinite
Per impostazione predefinita, i cluster GKE sono configurati per eseguire le seguenti operazioni:
- Inviare i log di sistema, gli audit log e i log delle applicazioni a Cloud Logging.
- Inviare le metriche di sistema a Cloud Monitoring.
- Utilizzare Google Cloud Managed Service per Prometheus per raccogliere le metriche di terze parti e definite dall'utente configurate e quindi inviarle a Cloud Monitoring. Google Cloud Managed Service per Prometheus ti consente di monitorare e creare avvisi sui tuoi carichi di lavoro utilizzando Prometheus, senza dover gestire e utilizzare Prometheus su larga scala manualmente.
Personalizzare e migliorare la raccolta dei dati
Per impostazione predefinita, GKE crea un repository Logging per archiviare i log di ogni cluster. Puoi controllare quali log e quali metriche, se presenti, vengono inviati dal cluster GKE a Cloud Logging e Cloud Monitoring.
Puoi anche controllare se abilitare Google Cloud Managed Service per Prometheus.
Per i cluster GKE Autopilot, non puoi disabilitare l'integrazione di Cloud Monitoring e Cloud Logging.
Metriche di osservabilità aggiuntive
Puoi raccogliere metriche di osservabilità aggiuntive abilitando uno o più pacchetti di metriche di osservabilità.
- Metriche del piano di controllo: monitora l'integrità dei componenti Kubernetes raccogliendo le metriche per il server API Kubernetes, lo scheduler e il gestore dei controller. Queste metriche sono segnali utili dell'integrità del servizio per definire gli obiettivi del livello di servizio (SLO).
- Metriche dello stato di Kube: monitora l'integrità degli oggetti Kubernetes come deployment, nodi e pod.
- Metriche cAdvisor/Kubelet: monitora l'integrità dei container e di kubelet.
Metriche di terze parti e definite dall'utente
Per monitorare le applicazioni di terze parti in esecuzione sui cluster, come Postgres, MongoDB e Redis, utilizza gli esportatori di Prometheus con Google Cloud Managed Service per Prometheus.
Puoi anche scrivere esportatori personalizzati per monitorare altri segnali di integrità e prestazioni.
Utilizzare i dati raccolti
Utilizza i dati raccolti per analizzare l'integrità delle applicazioni, eseguire il debug, risolvere i problemi e testare durante lo sviluppo, il deployment e la manutenzione delle applicazioni.
GKE fornisce funzionalità di osservabilità integrate per iniziare rapidamente:
Visualizza i dati raccolti per i cluster e i carichi di lavoro nelle dashboard di osservabilità di GKE. Puoi personalizzare le dashboard fornite per i seguenti scopi:
- Visualizzare le metriche chiave del cluster, come l'utilizzo della CPU, l'utilizzo della memoria e il numero di incidenti aperti.
- Visualizzare i cluster in base all'infrastruttura, ai carichi di lavoro o ai servizi.
- Ispezionare spazi dei nomi, nodi, carichi di lavoro, servizi, pod e container.
- Per pod e container, visualizzare le metriche in funzione del tempo e le voci di log.
Puoi anche creare le tue dashboard o importare le dashboard di Grafana per soddisfare le tue esigenze.
Visualizza i dettagli dei carichi di lavoro AI/ML in Google Cloud console, incluse risorse come JobSet, RayJob, PyTorchJob e deployment per il servizio di inferenza.
Nella scheda Osservabilità puoi creare criteri di avviso consigliati in modo da ricevere una notifica in caso di problemi. Per saperne di più sugli avvisi, consulta la Panoramica degli avvisi.
Crea SLO per monitorare gli obiettivi di prestazioni del servizio utilizzando le metriche GKE raccolte.
Utilizza i playbook GKE per risolvere problemi comuni come pod non pianificabili e container che si arrestano in modo anomalo ripetutamente dopo il riavvio.
Esplora e analizza i dati con strumenti come Esplora log, Esplora metriche e Error Reporting.
Esamina gli audit log di GKE che registrano le attività e gli accessi amministrativi nell'ambito di Cloud Audit Logs. Il criterio degli audit log determina quali eventi vengono registrati e se una voce di log appartiene a un log delle attività di amministrazione o a un log degli accessi ai dati.
Altre caratteristiche
GKE si integra con altri Google Cloud servizi per aiutarti a monitorare e gestire i cluster e i carichi di lavoro.
Utilizza la dashboard della postura di sicurezza per identificare i problemi di sicurezza in base ai nostri standard e alle best practice del settore.
Visualizza insight e suggerimenti per ottimizzare i cluster.
Utilizza il logging dei criteri di rete per risolvere i problemi relativi ai criteri di rete Kubernetes. Se utilizzi GKE Dataplane V2, il logging dei criteri di rete è integrato.
Prezzi
I prezzi per l'integrazione con Cloud Logging (inclusi Cloud Audit Logs), Cloud Monitoring e Google Cloud Managed Service per Prometheus si basano sulla quantità di log e metriche raccolte. Per i dettagli, consulta la pagina Prezzi.
Le funzionalità fornite da altri Google Cloud servizi elencati in Altre funzionalità hanno prezzi separati. Per ulteriori informazioni, consulta la sezione Prezzi delle pagine di documentazione.
Passaggi successivi
Osserva i cluster. Scopri come visualizzare le dashboard, organizzare le informazioni sui cluster e visualizzare i dettagli degli avvisi.
Abilita il logging degli audit a livello di sistema operativo dettagliato sui nodi del cluster GKE e scopri come esportare i log in Cloud Logging.
Per ulteriori informazioni su come utilizzare le funzionalità di osservabilità per risolvere i problemi di GKE, consulta Eseguire analisi storiche con Cloud Logging ed Eseguire il monitoraggio proattivo con Cloud Monitoring.