Unter- und überprovisionierte Arbeitslasten identifizieren

In diesem Dokument wird erläutert, wie Sie mit Statistiken und Empfehlungen unter- und überbereitgestellte Arbeitslasten identifizieren, die in Google Kubernetes Engine-Clustern (GKE-Clustern) ausgeführt werden. Nachdem Sie überprüft haben, ob die identifizierten Arbeitslasten von der Empfehlung zum Hoch- oder Herunterskalieren profitieren würden, können Sie die empfohlene Änderung vornehmen, um Kosten zu sparen oder die Zuverlässigkeit Ihrer Arbeitslast zu erhöhen. Wenn möglich, enthält die Empfehlung auch die prognostizierten monatlichen Einsparungen oder Kosten. Weitere Informationen finden Sie unter Kosten- oder Einsparungsschätzungen verstehen.

GKE bietet diese Informationen zu Arbeitslasten, die sowohl in Autopilot- als auch in Standardclustern ausgeführt werden. GKE bietet auch ähnliche Empfehlungen für ganze Cluster. Weitere Informationen finden Sie unter Unter- und überbereitgestellte GKE-Cluster identifizieren.

GKE überwacht Ihre Cluster und liefert Ihnen mit Active Assist Hinweise dazu, wie Sie Ihre Nutzung optimieren können. Dieser Dienst bietet Recommender, die Statistiken und Empfehlungen zur Verwendung von Ressourcen in Google Cloudgenerieren. Weitere Informationen zum Verwalten von Statistiken und Empfehlungen finden Sie unter Nutzung von GKE mit Statistiken und Empfehlungen optimieren.

Informationen und Empfehlungen für unter- und überdimensionierte Arbeitslasten erhalten

GKE stellt diese Statistiken und Empfehlungen an den folgenden Stellen in der Google Cloud Konsole bereit, nachdem das im folgenden Abschnitt beschriebene Verhalten beobachtet wurde:

Die Empfehlungen haben auf der Seite Arbeitslasten die folgenden Titel:

  • Überbereitgestellte Arbeitslasten: „Ressourcenanfragen verringern, um Kosten zu senken“
  • Unterprovisionierte Arbeitslasten: „Erhöhen Sie Ressourcenanfragen, um die Zuverlässigkeit zu verbessern.“

Sie können alle Arten von Statistiken und Empfehlungen auch über die Google Cloud CLI oder die Recommender API erhalten. Wenn Sie diese Typen speziell suchen möchten, folgen Sie der Anleitung zum Aufrufen von Statistiken und Empfehlungen und filtern Sie nach den Untertypen WORKLOAD_UNDERPROVISIONED und WORKLOAD_OVERPROVISIONED.

Nachdem Sie unter- oder überprovisionierte Arbeitslasten identifiziert haben, lesen Sie die Hinweise zur Anpassung der Größe von Arbeitslasten.

So erkennt GKE unter- und überprovisionierte Arbeitslasten

In der folgenden Tabelle werden die Signale beschrieben, die GKE verwendet, um unter- und überbereitgestellte Arbeitslasten zu identifizieren, die skaliert werden können, sowie der Schwellenwert für jedes Signal. Außerdem wird in dieser Tabelle die empfohlene Maßnahme für dieses Szenario aufgeführt.

Subtyp Signal Beobachtungszeitraum Details Empfehlung
WORKLOAD_UNDERPROVISIONED Die CPU- oder Arbeitsspeichernutzung ist hoch Letzte 15 Tage Eine Arbeitslast ist unterdimensioniert, wenn die CPU- oder Arbeitsspeicherauslastung in den letzten 15 Tagen mindestens 10% der Zeit über 150% lag. Arbeitslast skalieren, um Zuverlässigkeit zu erhöhen
WORKLOAD_OVERPROVISIONED Geringe CPU- oder Arbeitsspeichernutzung Letzte 15 Tage Eine Arbeitslast ist überdimensioniert, wenn die CPU- oder Arbeitsspeicherauslastung in den letzten 15 Tagen mindestens 90% der Zeit unter 50% lag. Arbeitslast herunterfahren, um Kosten zu sparen

GKE verwendet auch die folgenden Richtlinien, um zu bestimmen, wann Statistiken und Empfehlungen bereitgestellt werden:

  • GKE generiert keine Empfehlungen für den Zielmesswert des horizontalen Pod-Autoscalings (HPA), da die Verwendung dieses Messwerts zu Störungen führen kann.
  • Wenn vertikales Pod-Autoscaling (VPA) aktiviert ist, werden die Anforderungswerte automatisch verwaltet und GKE muss keine Empfehlung generieren.
  • GKE wartet möglicherweise bis zu drei Tage, bevor Empfehlungen für neue Arbeitslasten generiert werden.

Kostenschätzungen oder geschätzte Einsparungen

Wenn möglich, enthält die Empfehlung von GKE eine Schätzung der monatlichen Kosten oder Einsparungen, wenn Sie die Größe der Arbeitslast richtig dimensionieren. Diese Schätzung basiert auf den Arbeitslastkosten, die sich aus dem gewichteten Durchschnitt der Anfragekosten in Kombination mit den CPU- und Arbeitsspeicherkosten der Arbeitslast in den letzten 30 Tagen ergeben.

Geschätzte Kosten oder Einsparungen sind Prognosen, die auf früheren Ausgaben basieren. Sie sind keine Garantie für zukünftige Kosten oder Einsparungen.

Damit Sie diese Schätzungen sehen können, müssen folgende Voraussetzungen erfüllt sein:

  • Sie haben die erforderliche Berechtigung billing.accounts.getSpendingInformation, um Ausgabeninformationen abzurufen. Weitere Informationen finden Sie unter Cloud Billing-Zugriff.
  • Die GKE-Kostenzuordnung ist für den Cluster aktiviert. Weitere Informationen finden Sie unter GKE-Kostenaufteilung aktivieren.

Weitere Informationen zu den Kosten aller Ihrer GKE-Cluster, einschließlich einer detaillierteren Aufschlüsselung nach Namespaces und Arbeitslasten, finden Sie unter Wichtige Ausgabeninformationen für die GKE-Ressourcenzuordnung und Clusterkosten abrufen.

Weitere Informationen zu den Kosten für die Ausführung eines GKE-Cluster finden Sie unter GKE-Preise.

Überlegungen zur Anpassung der Größe von Arbeitslasten

Bevor Sie einer Empfehlung zum Skalieren einer Arbeitslast nachkommen, sollten Sie Folgendes berücksichtigen:

  • Sehen Sie sich die Ressourcennutzung der Arbeitslast an, um zu sehen, wie sie sich verhält und ob sie mehr oder weniger CPU und Arbeitsspeicher als erwartet verwendet. Eine Anleitung finden Sie unter Ressourcenanfragen analysieren.
  • Bei Arbeitslasten der Batchverarbeitung wird die Auslastung aus Kostengründen möglicherweise bewusst hoch gehalten. Wenn die zugewiesenen Ressourcen für die Batchjobs ausreichen, müssen Sie die stark ausgelastete Arbeitslast, die als unterdimensioniert identifiziert wurde, nicht hochskalieren.
  • GKE hat nur eingeschränkten Einblick in die tatsächliche Arbeitsspeichernutzung von Arbeitslasten, die auf der Java Virtual Machine (JVM) basieren. Prüfen Sie Empfehlungen für diese Arten von Arbeitslasten besonders sorgfältig, bevor Sie sie anwenden.

Empfehlung zur Anpassung der Größe einer Arbeitslast umsetzen

Sie können die Größe einer Arbeitslast anpassen, um die Ressourcennutzung der Arbeitslast besser zu berücksichtigen. Dazu haben Sie folgende Möglichkeiten:

  • Aktivieren Sie das vertikale Pod-Autoscaling für die Arbeitslast. Weitere Informationen finden Sie unter Pod-Ressourcenanfragen automatisch festlegen.
  • Ändern Sie die Anfragen und Limits manuell gemäß der Empfehlung:

    • Unterdimensionierte Arbeitslast: Um die Empfehlung zur Größenanpassung einer unterdimensionierten Arbeitslast umzusetzen, erhöhen Sie die Ressourcenanforderungen und ‑limits für die Arbeitslast. Wenn Sie diese Empfehlung umsetzen, tragen Sie dazu bei, dass Ihre Arbeitslast zuverlässig bleibt, da sie über die entsprechende Menge an Ressourcen für ihre Anwendungen verfügt.
    • Übermäßig bereitgestellte Arbeitslast: Wenn Sie die Empfehlung zur Größenanpassung einer übermäßig bereitgestellten Arbeitslast umsetzen möchten, verringern Sie die Ressourcenanforderungen und ‑limits für die Arbeitslast. Passen Sie die CPU- und Arbeitsspeicherzuweisungen des Clusters an Ihre Arbeitslastanforderungen an. Wenn Sie diese Empfehlung umsetzen, tragen Sie dazu bei, dass Sie nur die Ressourcen verwenden, die Sie zum Ausführen Ihrer Arbeitslast benötigen.

Nächste Schritte