Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Anhand der CPU-Auslastung skalieren

Die einfachste Form von Autoscaling besteht darin, eine verwaltete Instanzgruppe (managed instance group, MIG) anhand der CPU-Auslastung ihrer Instanzen zu skalieren.

Sie können MIGs auch anhand von Load-Balancing-Bereitstellungskapazität, Monitoringmesswerten oder Zeitplänen automatisch skalieren.

Hinweise

Prüfen Sie die Einschränkungen für Autoscaling.
Grundlagen von Autoscaling
Richten Sie die Authentifizierung ein, falls Sie dies noch nicht getan haben. Bei der Authentifizierung wird Ihre Identität für den Zugriff auf Google Cloud Dienste und APIs überprüft. Wenn Sie Code oder Beispiele aus einer lokalen Entwicklungsumgebung ausführen möchten, können Sie sich mit einer der folgenden Optionen bei Compute Engine authentifizieren:
Wählen Sie den Tab für die Verwendung der Beispiele auf dieser Seite aus:
Console

Wenn Sie über die Google Cloud console auf Google Cloud Dienste und APIs zugreifen, müssen Sie die Authentifizierung nicht einrichten.
gcloud
1. Installieren Sie die Google Cloud CLI. Initialisieren Sie die Google Cloud CLI nach der Installation mit dem folgenden Befehl:
  gcloud init
  Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.
  
  Hinweis: Wenn Sie die gcloud CLI zuvor installiert haben, prüfen Sie, ob Sie die aktuelle Version haben, indem Sie gcloud components update ausführen.
Legen Sie eine Standardregion und -zone fest.

REST

Wenn Sie die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, verwenden Sie die Anmeldedaten, die Sie der gcloud CLI bereitstellen.

Installieren Sie die Google Cloud CLI.

Wenn Sie einen externen Identitätsanbieter (IdP) verwenden, müssen Sie sich zuerst mit Ihrer föderierten Identität in der gcloud CLI anmelden.

Weitere Informationen finden Sie in der Google Cloud Authentifizierungsdokumentation unter Für die Verwendung von REST authentifizieren.

Anhand der CPU-Auslastung skalieren

Sie können ein Autoscaling anhand der durchschnittlichen CPU-Auslastung einer verwalteten Instanzgruppe durchführen. Anhand dieser Richtlinie erfasst das Autoscaling die CPU-Auslastung der Instanzen in der Gruppe und bestimmt, ob eine Skalierung erforderlich ist. Sie legen die Ziel-CPU-Auslastung fest, die das Autoscaling nach Möglichkeit einhalten soll.

Das Autoscaling behandelt das Ziel-CPU-Auslastungsniveau als Bruchteil der durchschnittlichen Nutzung aller vCPUs in der Instanzgruppe im Zeitverlauf. Wenn die durchschnittliche Auslastung aller vCPUs die Zielauslastung überschreitet, fügt das Autoscaling weitere virtuelle Maschinen hinzu. Wenn die durchschnittliche Auslastung aller vCPUs geringer als die Zielauslastung ist, entfernt das Autoscaling Instanzen. Bei einer Zielauslastung von 0,75 muss das Autoscaling beispielsweise eine durchschnittliche Nutzung von 75% für alle vCPUs in der Instanzgruppe aufrechterhalten.

Sie können die Skalierung auch auf Grundlage der prognostizierten CPU-Auslastung ausführen. Weitere Informationen und Informationen dazu, ob dies für Ihre Arbeitslast geeignet ist, finden Sie unter Anhand von Vorhersagen skalieren.

Autoscaling anhand der CPU-Auslastung aktivieren

Verwenden Sie eine der folgenden Optionen, um das Autoscaling anhand der CPU-Auslastung zu aktivieren. Wenn Sie einen Stabilisierungszeitraum konfigurieren möchten, um die Geschwindigkeit der Aufskalierung zu steuern, müssen Sie entweder die Google Cloud CLI oder REST verwenden.

Erforderliche Berechtigungen für diese Aufgabe

Zum Ausführen dieser Aufgabe benötigen Sie die folgenden Berechtigungen:

compute.autoscalers.create für das Projekt
compute.instanceGroupManagers.use für das Projekt

Console

Rufen Sie in der Console die Seite Instanzgruppen auf.

Zu den Instanzgruppen
Wenn Sie eine Instanzgruppe haben, klicken Sie auf den Namen der Instanzgruppe und dann auf Bearbeiten. Gehen Sie auf der Seite „Instanzgruppe bearbeiten“ so vor:
1. Klicken Sie auf Gruppengröße und Autoscaling , um den Bereich zu maximieren.
2. Klicken Sie auf Autoscaling konfigurieren.
Wenn Sie keine Instanzgruppe haben, klicken Sie auf Instanzgruppe erstellen und gehen Sie so vor:
1. Geben Sie im Feld Name einen Namen für die Gruppe an.
2. Wählen Sie in der Liste Instanzvorlage eine Vorlage aus.
3. Wählen Sie im Abschnitt Standort je nachdem, ob Sie eine zonale oder regionale MIG erstellen, eine Option aus:
  - Wählen Sie für eine zonale MIG Einzelne Zone und dann eine Region und eine Zone aus.
  - Wählen Sie für eine regionale MIG Mehrere Zonen und dann eine Region und Zonen aus.
Im Abschnitt Autoscaling wird standardmäßig ein Autoscaling-Signal für die CPU-Auslastung hinzugefügt. Sie können entweder die Standardwerte für das Signal verwenden oder so vorgehen:
1. Geben Sie die Mindest- und Höchstanzahl der Instanzen an, die das Autoscaling in dieser Gruppe erstellen soll.
2. Wenn Sie die Ziel-CPU-Auslastung bearbeiten möchten, klicken Sie auf das CPU-Auslastungssignal, um den Bereich zu maximieren, und geben Sie den Prozentsatz an.
  1. Wählen Sie unter Vorausschauendes Autoscaling die Option Aus aus. Weitere Informationen zum vorausschauenden Autoscaling und dazu, ob es für Ihre Arbeitslast geeignet ist, finden Sie unter Anhand von Vorhersagen skalieren.
3. Klicken Sie auf Fertig.
Über die Initialisierungsphase können Sie angeben, wie lange Ihre Anwendung zur Initialisierung benötigt. Wenn Sie die Initialisierungsphase genau definieren, verbessern Sie die Autoscaling-Entscheidungen. Beim horizontalen Skalieren ignoriert beispielsweise das Autoscaling Daten von VMs, die noch initialisiert werden, da diese VMs möglicherweise noch nicht die normale Nutzung Ihrer Anwendung darstellen. Die Standardinitialisierungsphase beträgt 60 Sekunden.
Klicken Sie auf Speichern.

gcloud

Mit dem Unterbefehl set-autoscaling können Sie das Autoscaling für eine verwaltete Instanzgruppe aktivieren. Durch den folgenden Befehl wird z. B. ein Autoscaling mit einer CPU-Zielauslastung von 60 % erstellt. Neben dem Parameter --target-cpu-utilization ist beim Erstellen eines Autoscalings auch der Parameter --max-num-replicas erforderlich:

gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \
    --max-num-replicas 20 \
    --target-cpu-utilization 0.60 \
    --cool-down-period 90 \
    --stabilization-period 240

Optional können Sie die folgenden Flags festlegen, um das Autoscaling zu steuern:

Sie können das Flag --cool-down-period verwenden, um die Initialisierungsphase festzulegen. Dieser Wert teilt dem Autoscaling mit, wie lange Ihre Anwendung zur Initialisierung benötigt. Wenn Sie die Initialisierungsphase genau definieren, verbessern Sie die Autoscaling-Entscheidungen. Beim horizontalen Skalieren ignoriert beispielsweise das Autoscaling Daten von VMs, die noch initialisiert werden, da diese VMs möglicherweise noch nicht die normale Nutzung Ihrer Anwendung darstellen. Die Standardinitialisierungsphase beträgt 60 Sekunden.
Mit dem Flag --stabilization-period können Sie den Stabilisierungszeitraum festlegen, der die Dauer für das Herunterskalieren Ihrer MIG bestimmt. Ein kürzerer Stabilisierungszeitraum bedeutet, dass VMs schneller gelöscht werden, um herunterzuskalieren. Der Wert muss zwischen `0` und `3600` Sekunden liegen. Der Standardwert ist `600` Sekunden. Weitere Informationen finden Sie unter Best Practices für den Stabilisierungszeitraum.

Optional können Sie das vorausschauende Autoscaling aktivieren, damit bereits vor dem Auftreten der erwarteten Arbeitslast horizontal skaliert wird. Informationen dazu, ob vorausschauendes Autoscaling für Ihre Arbeitslast geeignet ist, finden Sie unter Anhand von Vorhersagen skalieren.

Mit dem instance-groups managed describe-Unterbefehl können Sie prüfen, ob Autoscaling erfolgreich aktiviert ist. Damit wird die entsprechende verwaltete Instanzgruppe beschrieben und es werden Informationen zu den Autoscaling-Features für diese Instanzgruppe bereitgestellt:

gcloud compute instance-groups managed describe example-managed-instance-group

Eine Liste der verfügbaren gcloud-Befehle und Flags finden Sie in der Referenz zu gcloud.

REST

Verwenden Sie zum Erstellen eines Autoscalings die Methode autoscalers.insert für eine zonale MIG oder die Methode regionAutoscalers.insert für eine regionale MIG.

Im folgenden Beispiel wird ein Autoscaling für eine zonale MIG erstellt:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers

Der Text Ihrer Anfrage muss die Felder name, target und autoscalingPolicy enthalten. autoscalingPolicy muss cpuUtilization und maxNumReplicas definieren.

Optional können Sie die folgenden Felder festlegen, um das Autoscaling zu steuern:

Sie können das Feld coolDownPeriodSec verwenden, um die Initialisierungsphase festzulegen. Dieser Wert teilt dem Autoscaling mit, wie lange Ihre Anwendung zur Initialisierung benötigt. Wenn Sie die Initialisierungsphase genau definieren, verbessern Sie die Autoscaling-Entscheidungen. Beim horizontalen Skalieren ignoriert beispielsweise das Autoscaling Daten von VMs, die noch initialisiert werden, da diese VMs möglicherweise noch nicht die normale Nutzung Ihrer Anwendung darstellen. Die Standardinitialisierungsphase beträgt 60 Sekunden.
Mit dem Feld stabilizationPeriodSec können Sie den Stabilisierungszeitraum festlegen, der die Dauer für das Herunterskalieren Ihrer MIG bestimmt. Ein kürzerer Stabilisierungszeitraum bedeutet, dass VMs schneller gelöscht werden, um herunterzuskalieren. Der Wert muss zwischen `0` und `3600` Sekunden liegen. Der Standardwert ist `600` Sekunden. Weitere Informationen finden Sie unter Best Practices für den Stabilisierungszeitraum.

{
  "name": "example-autoscaler",
  "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group",
  "autoscalingPolicy": {
    "maxNumReplicas": 10,
    "cpuUtilization": {
      "utilizationTarget": 0.6
    },
    "coolDownPeriodSec": 90,
    "stabilizationPeriodSec": 240
  }
}

Weitere Informationen zum Aktivieren des Autoscalings auf Grundlage der CPU-Auslastung finden Sie in der Anleitung Autoscaling für hochskalierbare Anwendungen verwenden.

Autoscaling bei starker CPU-Auslastung

Wenn bei einer starken CPU-Auslastung fast ein Wert von 100 % erreicht wird, geht das Autoscaling davon aus, dass die Gruppe bereits stark überlastet ist. In diesen Fällen erhöht das Autoscaling die Anzahl virtueller Maschinen um höchstens 50 %.

Nächste Schritte

Mehr über die Aktivierung des vorausschauenden Autoscaling erfahren
Autoscalings verwalten
Mehr über die Faktoren des Autoscalings erfahren
Mehr über das Skalieren von Gruppen mit mehreren Autoscaling-Signalen erfahren.

Anhand der CPU-Auslastung skalieren Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Hinweise

Console

gcloud

REST

Anhand der CPU-Auslastung skalieren

Autoscaling anhand der CPU-Auslastung aktivieren

Erforderliche Berechtigungen für diese Aufgabe

Console

gcloud

REST

Autoscaling bei starker CPU-Auslastung

Nächste Schritte

Anhand der CPU-Auslastung skalieren