Clusterprobleme diagnostizieren

Die Funktion „Health Check“ überwacht regelmäßig den Zustand der Cluster-Steuerungsebene und mehrerer kritischer Komponenten. So können Sie potenzielle Probleme mit Ihren Clustern erkennen und diagnostizieren.

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.

Probleme festgestellt

Die Cluster-Systemdiagnose erkennt die folgenden Probleme in einem Cluster und benachrichtigt Sie darüber:

  • kube-scheduler-Status auf Steuerungsebenenknoten: Wenn der kube-scheduler-Status fehlerhaft ist, deutet dies darauf hin, dass der Cluster Probleme beim Zuweisen von Pods zu Knoten hat. Zur weiteren Untersuchung können Sie das kube-scheduler-Pod-Log ansehen.

  • kube-controller-manager-Status auf Knoten der Steuerungsebene: Der kube-controller-manager überwacht verschiedene Controller, darunter die Controller für ReplicaSet, Deployment und Namespace. Wenn der kube-controller-manager als fehlerhaft eingestuft wird, deutet dies darauf hin, dass einer oder mehrere der von ihm verwalteten Controller möglicherweise nicht richtig funktionieren. Um das genaue Problem zu ermitteln, können Sie das kube-controller-manager-Pod-Log untersuchen. Es enthält möglicherweise weitere Informationen zu den fehlerhaften Controllern.

  • Kapazität des Root-Volumes: Die Systemdiagnose prüft, ob das Root-Volume jedes Knotens der Steuerungsebene ausreichend Kapazität hat. Wenn die verfügbare Kapazität unter 512 MB fällt, werden Sie vom Health Checker auf das potenzielle Risiko hingewiesen, dass der Speicherplatz ausgeht.

Systemdiagnoseereignisse ansehen

Führen Sie den folgenden Befehl aus, um Warnungen der Systemdiagnose für einen bestimmten Cluster aufzurufen:

gcloud container azure clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

Ersetzen Sie Folgendes:

  • CLUSTER_NAME: der Name des Clusters
  • GOOGLE_CLOUD_LOCATION: der Name des Google Cloud-Standorts, der den Cluster verwaltet.

Hier ist ein Auszug der Art von Ausgabe, die Sie erwarten können:

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

In diesem Beispiel gibt die Fehlermeldung an, dass eine kube-controller-manager-Komponente fehlerhaft ist und die Kapazität des Root-Volumes eines Steuerungsebenenknotens gering wird.

Nächste Schritte

Wenn Sie weitere Unterstützung benötigen, wenden Sie sich an den Cloud Customer Care.