Auf dieser Seite wird beschrieben, wie Sie den Status Ihrer Anwendungen verstehen und für deren Verfügbarkeit und Zuverlässigkeit sorgen können.
Standardfunktionen für die Beobachtbarkeit
GKE-Cluster sind standardmäßig für Folgendes konfiguriert:
- System-, Audit- und Anwendungslogs an Cloud Logging senden
- Systemmesswerte an Cloud Monitoring senden.
- Verwenden Sie Google Cloud Managed Service for Prometheus, um konfigurierte benutzerdefinierte Messwerte und solche von Drittanbietern zu erfassen und dann an Cloud Monitoring zu senden. Mit Google Cloud Managed Service for Prometheus können Sie Ihre Arbeitslasten mithilfe von Prometheus überwachen und Benachrichtigungen dazu senden, ohne Prometheus manuell in großem Umfang verwalten und betreiben zu müssen.
Datenerhebung anpassen und optimieren
Standardmäßig erstellt GKE ein Logging-Repository zum Speichern von Logs für die einzelnen Cluster. Sie können steuern, welche Logs und welche Messwerte gegebenenfalls von Ihrem GKE-Cluster an Cloud Logging und Cloud Monitoring gesendet werden.
Sie können auch festlegen, ob Sie Google Cloud Managed Service for Prometheus aktivieren möchten.
Hinweis: Für GKE Autopilot-Cluster können Sie die Cloud Monitoring- und Cloud Logging-Einbindung nicht deaktivieren.
Zusätzliche Messwerte zur Beobachtbarkeit
Sie können zusätzliche Messwerte zur Beobachtbarkeit erfassen, indem Sie ein oder mehrere Pakete für Messwerte zur Beobachtbarkeit aktivieren.
- Messwerte der Steuerungsebene: Zustand von Kubernetes-Komponenten überwachen, indem Messwerte für den Kubernetes API-Server, Scheduler und Controller Manager erfasst werden. Diese Messwerte sind nützliche Signale für den Dienststatus, um Service Level Objectives (SLOs) zu definieren.
- Kube-Statusmesswerte: Zustand von Kubernetes-Objekten wie Bereitstellungen, Knoten und Pods überwachen.
- cAdvisor-/Kubelet-Messwerte: Überwachen Sie den Zustand von Containern und Kubelet.
Drittanbieter- und benutzerdefinierte Messwerte
Wenn Sie Anwendungen von Drittanbietern, die auf Ihren Clustern ausgeführt werden, wie Postgres, MongoDB und Redis, überwachen möchten, verwenden Sie Prometheus-Exporteure mit Google Cloud Managed Service for Prometheus.
Sie können auch benutzerdefinierte Exporter schreiben, um andere Signale für Zustand und Leistung zu überwachen.
Erfasste Daten verwenden
Mit den erfassten Daten können Sie den Zustand Ihrer Anwendungen analysieren, Fehler beheben und Tests durchführen, während Sie Anwendungen entwickeln, bereitstellen und warten.
GKE bietet integrierte Funktionen für die Beobachtbarkeit, damit Sie schnell loslegen können:
Die erfassten Daten für Ihre Cluster und Arbeitslasten können Sie in den GKE-Beobachtbarkeitsdashboards ansehen. Sie können die bereitgestellten Dashboards für die folgenden Zwecke anpassen:
- Sie können sich die wichtigsten Clustermesswerte ansehen, z. B. die CPU-Auslastung, die Speicherauslastung und die Anzahl der offenen Vorfälle.
- Sie können Cluster nach Infrastruktur, Arbeitslasten oder Diensten anzeigen.
- Sie können Namespaces, Knoten, Arbeitslasten, Dienste, Pods und Container untersuchen.
- Für Pods und Container können Sie Messwerte als Zeitfunktion sowie Logeinträge aufrufen.
Sie können auch eigene Dashboards erstellen oder Grafana-Dashboards importieren, um Ihre Anforderungen zu erfüllen.
Auf dem Tab Observability (Beobachtbarkeit) können Sie empfohlene Benachrichtigungsrichtlinien erstellen, damit Sie über Probleme benachrichtigt werden. Weitere Informationen zu Benachrichtigungen finden Sie unter Benachrichtigungen – Übersicht.
SLOs erstellen, um die Leistungsziele Ihres Dienstes anhand der erfassten GKE-Messwerte zu überwachen.
Verwenden Sie GKE-Playbooks, um häufige Probleme wie nicht planbare Pods und Container, die nach dem Neustart wiederholt abstürzen zu beheben.
Sie können Ihre Daten mit Tools wie dem Log-Explorer, dem Metrics Explorer und Error Reporting untersuchen und analysieren.
Prüfen Sie die GKE-Audit-Logs, in denen administrative Aktivitäten und Zugriffe als Teil von Cloud-Audit-Logs aufgezeichnet werden. In der Audit-Log-Richtlinie wird festgelegt, welche Ereignisse aufgezeichnet werden und ob ein Logeintrag zu einem Administratoraktivitätslog oder einem Datenzugriffslog gehört.
Weitere Funktionen
GKE ist in andere Google Cloud -Dienste eingebunden, mit denen Sie Ihre Cluster und Arbeitslasten überwachen und verwalten können.
Verwenden Sie das Dashboard für den Sicherheitsstatus, um Sicherheitsbedenken auf Grundlage unserer Standards und Best Practices der Branche zu ermitteln.
Statistiken und Empfehlungen zur Optimierung Ihrer Cluster ansehen
Verwenden Sie das Logging von Netzwerkrichtlinien, um Probleme mit Kubernetes-Netzwerkrichtlinien zu beheben. Wenn Sie GKE Dataplane V2 verwenden, ist das Logging von Netzwerkrichtlinien integriert.
Preise
Die Preise für die Integration mit Cloud Logging (einschließlich Cloud-Audit-Logs), Cloud Monitoring und Google Cloud Managed Service for Prometheus basieren auf der Menge der erfassten Logs und Messwerte. Weitere Informationen zu den Preisen erhalten Sie in der Preisübersicht.
Für Funktionen, die von anderen Google Cloud Diensten bereitgestellt werden, die unter Weitere Funktionen aufgeführt sind, gelten separate Preise. Weitere Informationen finden Sie im Abschnitt „Preise“ auf diesen Dokumentationsseiten.
Nächste Schritte
Cluster beobachten. Hier erfahren Sie, wie Sie Dashboards aufrufen, Clusterinformationen organisieren und Benachrichtigungsdetails anzeigen lassen.
Ausführliches Audit-Logging auf Betriebssystemebene für GKE-Clusterknoten aktivieren und Logs nach Cloud Logging exportieren
Weitere Informationen zur Verwendung von Beobachtbarkeitsfunktionen zur Fehlerbehebung in GKE finden Sie unter Verlaufsanalyse mit Cloud Logging durchführen und Proaktives Monitoring mit Cloud Monitoring durchführen.