Osservabilità per GKE

Questa pagina descrive come comprendere l'integrità delle applicazioni e mantenerne la disponibilità e l'affidabilità.

Funzionalità di osservabilità predefinite

Per impostazione predefinita, i cluster GKE sono configurati per eseguire le seguenti operazioni:

Personalizzare e migliorare la raccolta dei dati

Per impostazione predefinita, GKE crea un repository Logging per archiviare i log di ogni cluster. Puoi controllare quali log e quali metriche, se presenti, vengono inviati dal cluster GKE a Cloud Logging e Cloud Monitoring.

Puoi anche controllare se abilitare Google Cloud Managed Service per Prometheus.

Per i cluster GKE Autopilot, non puoi disabilitare l'integrazione di Cloud Monitoring e Cloud Logging.

Metriche di osservabilità aggiuntive

Puoi raccogliere metriche di osservabilità aggiuntive abilitando uno o più pacchetti di metriche di osservabilità.

  • Metriche del piano di controllo: monitora l'integrità dei componenti Kubernetes raccogliendo le metriche per il server API Kubernetes, lo scheduler e il gestore dei controller. Queste metriche sono segnali utili dell'integrità del servizio per definire gli obiettivi del livello di servizio (SLO).
  • Metriche dello stato di Kube: monitora l'integrità degli oggetti Kubernetes come deployment, nodi e pod.
  • Metriche cAdvisor/Kubelet: monitora l'integrità dei container e di kubelet.

Metriche di terze parti e definite dall'utente

Per monitorare le applicazioni di terze parti in esecuzione sui cluster, come Postgres, MongoDB e Redis, utilizza gli esportatori di Prometheus con Google Cloud Managed Service per Prometheus.

Puoi anche scrivere esportatori personalizzati per monitorare altri segnali di integrità e prestazioni.

Utilizzare i dati raccolti

Utilizza i dati raccolti per analizzare l'integrità delle applicazioni, eseguire il debug, risolvere i problemi e testare durante lo sviluppo, il deployment e la manutenzione delle applicazioni.

GKE fornisce funzionalità di osservabilità integrate per iniziare rapidamente:

  • Visualizza i dati raccolti per i cluster e i carichi di lavoro nelle dashboard di osservabilità di GKE. Puoi personalizzare le dashboard fornite per i seguenti scopi:

    • Visualizzare le metriche chiave del cluster, come l'utilizzo della CPU, l'utilizzo della memoria e il numero di incidenti aperti.
    • Visualizzare i cluster in base all'infrastruttura, ai carichi di lavoro o ai servizi.
    • Ispezionare spazi dei nomi, nodi, carichi di lavoro, servizi, pod e container.
    • Per pod e container, visualizzare le metriche in funzione del tempo e le voci di log.

    Puoi anche creare le tue dashboard o importare le dashboard di Grafana per soddisfare le tue esigenze.

  • Visualizza i dettagli dei carichi di lavoro AI/ML in Google Cloud console, incluse risorse come JobSet, RayJob, PyTorchJob e deployment per il servizio di inferenza.

    Vai alla Google Cloud console

  • Nella scheda Osservabilità puoi creare criteri di avviso consigliati in modo da ricevere una notifica in caso di problemi. Per saperne di più sugli avvisi, consulta la Panoramica degli avvisi.

  • Crea SLO per monitorare gli obiettivi di prestazioni del servizio utilizzando le metriche GKE raccolte.

  • Utilizza i playbook GKE per risolvere problemi comuni come pod non pianificabili e container che si arrestano in modo anomalo ripetutamente dopo il riavvio.

  • Esplora e analizza i dati con strumenti come Esplora log, Esplora metriche e Error Reporting.

  • Esamina gli audit log di GKE che registrano le attività e gli accessi amministrativi nell'ambito di Cloud Audit Logs. Il criterio degli audit log determina quali eventi vengono registrati e se una voce di log appartiene a un log delle attività di amministrazione o a un log degli accessi ai dati.

Altre caratteristiche

GKE si integra con altri Google Cloud servizi per aiutarti a monitorare e gestire i cluster e i carichi di lavoro.

Prezzi

I prezzi per l'integrazione con Cloud Logging (inclusi Cloud Audit Logs), Cloud Monitoring e Google Cloud Managed Service per Prometheus si basano sulla quantità di log e metriche raccolte. Per i dettagli, consulta la pagina Prezzi.

Le funzionalità fornite da altri Google Cloud servizi elencati in Altre funzionalità hanno prezzi separati. Per ulteriori informazioni, consulta la sezione Prezzi delle pagine di documentazione.

Passaggi successivi