Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Scalabilità basata sull'utilizzo della CPU

La forma più semplice di scalabilità automatica consiste nello scalare un gruppo di istanze gestite (MIG) in base all'utilizzo della CPU delle sue istanze.

Puoi anche applicare la scalabilità automatica a un MIG in base alla capacità di gestione del bilanciamento del carico, alle metriche di monitoraggio o alle pianificazioni.

Prima di iniziare

Esamina le limitazioni del gestore della scalabilità automatica.
Scopri i concetti fondamentali del gestore della scalabilità automatica.
Se non l'hai ancora fatto, configura l'autenticazione. L'autenticazione verifica la tua identità per l'accesso ad API e servizi Google Cloud . Per eseguire codice o esempi da un ambiente di sviluppo locale, puoi autenticarti su Compute Engine selezionando una delle seguenti opzioni:
Seleziona la scheda relativa alla modalità di utilizzo degli esempi in questa pagina:
Console

Quando utilizzi la Google Cloud console per accedere a Google Cloud servizi e API, non devi configurare l'autenticazione.
gcloud
1. Installa Google Cloud CLI. Dopo l'installazione, inizializza Google Cloud CLI eseguendo il comando seguente:
  gcloud init
  Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.
  
  Nota: se hai già installato gcloud CLI, assicurati di avere l'ultima versione eseguendo gcloud components update.
Imposta una regione e una zona predefinite.

REST

Per utilizzare gli esempi di API REST in questa pagina in un ambiente di sviluppo locale, utilizzi le credenziali che fornisci a gcloud CLI.

Installa Google Cloud CLI.

Se utilizzi un provider di identità (IdP) esterno, devi prima accedere a gcloud CLI con la tua identità federata.

Per saperne di più, consulta Autenticati per usare REST nella Google Cloud documentazione sull'autenticazione di.

Scalabilità basata sull'utilizzo della CPU

Puoi utilizzare la scalabilità automatica in base all'utilizzo medio della CPU di un gruppo di istanze gestite (MIG). L'utilizzo di questa policy indica al gestore della scalabilità automatica di raccogliere l'utilizzo della CPU delle istanze nel gruppo e di determinare se è necessario eseguire la scalabilità. Imposti l'utilizzo target della CPU che il gestore della scalabilità automatica deve mantenere e il gestore della scalabilità automatica si adopera per mantenere questo livello.

Il gestore della scalabilità automatica tratta il livello di utilizzo della CPU target come una frazione dell'utilizzo medio di tutte le vCPU nel tempo nel gruppo di istanze. Se l'utilizzo medio delle vCPU totali supera l'utilizzo target, il gestore della scalabilità automatica aggiunge altre istanze VM. Se l'utilizzo medio delle vCPU totali è inferiore all'utilizzo target, il gestore della scalabilità automatica rimuove le istanze. Ad esempio, l'impostazione di un utilizzo target di 0,75 indica al gestore della scalabilità automatica di mantenere un utilizzo medio del 75% tra tutte le vCPU del gruppo di istanze.

Puoi anche eseguire la scalabilità in base all'utilizzo previsto della CPU. Per ulteriori informazioni e per sapere se questa opzione è adatta al tuo workload, consulta Scalabilità basata sulle previsioni.

Attiva la scalabilità automatica basata sull'utilizzo della CPU

Per attivare la scalabilità automatica basata sull'utilizzo della CPU, utilizza una delle seguenti opzioni. Se vuoi configurare un periodo di stabilizzazione per controllare la velocità dello scale in, devi utilizzare Google Cloud CLI o REST.

Autorizzazioni richieste per questa attività

Per eseguire questa attività, devi disporre delle seguenti autorizzazioni:

compute.autoscalers.create sul progetto
compute.instanceGroupManagers.use sul progetto

Console

Nella console, vai alla pagina Gruppi di istanze.

Vai a Gruppi di istanze
Se hai un gruppo di istanze, fai clic sul nome del gruppo di istanze, quindi fai clic su Modifica. Nella pagina di modifica del gruppo di istanze, segui questi passaggi:
1. Fai clic su Dimensioni del gruppo e scalabilità automatica per espandere la sezione.
2. Fai clic su Configura scalabilità automatica.
Se non hai un gruppo di istanze, fai clic su Crea gruppo di istanze e segui questi passaggi:
1. Nel campo Nome, specifica un nome per il gruppo.
2. Nell'elenco Template di istanza, seleziona un template.
3. Nella sezione Località, a seconda che tu stia creando un MIG a livello di zona o di regione, scegli un'opzione come segue:
  - Per un MIG a livello di zona, seleziona Zona singola, quindi seleziona una regione e una zona.
  - Per un MIG a livello di regione, seleziona Più zone, quindi seleziona una regione e le zone.
Nella sezione Scalabilità automatica, per impostazione predefinita viene aggiunto un indicatore di scalabilità automatica per l'utilizzo della CPU. Puoi utilizzare i valori predefiniti per l'indicatore o eseguire le seguenti operazioni:
1. Specifica il numero minimo e massimo di istanze che vuoi che il gestore della scalabilità automatica crei in questo gruppo.
2. Per modificare l'utilizzo della CPU target, fai clic sull'indicatore di utilizzo della CPU per espandere la sezione e specificare la percentuale.
  1. In Scalabilità automatica predittiva, seleziona Off. Per saperne di più sulla scalabilità automatica predittiva e per sapere se è adatta al tuo workload, consulta Scalabilità basata sulle previsioni.
3. Fai clic su Fine.
Puoi utilizzare Periodo di inizializzazione per comunicare al gestore della scalabilità automatica il tempo necessario per l'inizializzazione della tua applicazione. Specificando un periodo di inizializzazione preciso è possibile migliorare le decisioni del gestore della scalabilità automatica. Ad esempio, durante lo scale out, il gestore della scalabilità automatica ignora i dati provenienti dalle VM che sono ancora in fase di inizializzazione, perché potrebbero non rappresentare il normale utilizzo della tua applicazione. Il periodo di inizializzazione predefinito è di 60 secondi.
Fai clic su Salva.

gcloud

Utilizza il sottocomando set-autoscaling per abilitare la scalabilità automatica per un gruppo di istanze gestite. Ad esempio, il seguente comando crea un gestore della scalabilità automatica con un utilizzo della CPU target del 60%. Quando crei un gestore della scalabilità automatica, oltre al parametro --target-cpu-utilization, è necessario anche il parametro --max-num-replicas:

gcloud compute instance-groups managed set-autoscaling example-managed-instance-group \
    --max-num-replicas 20 \
    --target-cpu-utilization 0.60 \
    --cool-down-period 90 \
    --stabilization-period 240

Facoltativamente, imposta i seguenti flag per controllare la scalabilità automatica:

Puoi impostare il flag --cool-down-period per impostare il periodo di inizializzazione, che indica al gestore della scalabilità automatica il tempo necessario per l'inizializzazione dell'applicazione. Specificando un periodo di inizializzazione preciso è possibile migliorare le decisioni del gestore della scalabilità automatica. Ad esempio, durante lo scale out, il gestore della scalabilità automatica ignora i dati provenienti dalle VM che sono ancora in fase di inizializzazione, perché potrebbero non rappresentare il normale utilizzo della tua applicazione. Il periodo di inizializzazione predefinito è di 60 secondi.
Puoi utilizzare il flag --stabilization-period per impostare il periodo di stabilizzazione, che determina la durata dello fare lo scale in del MIG. Un periodo di stabilizzazione più breve indica un'eliminazione più rapida delle VM per fare lo scale in. Il valore deve essere compreso tra `0` e `3600` secondi. Il valore predefinito è `600` secondi. Per saperne di più, consulta Best practice per il periodo di stabilizzazione.

Facoltativamente, puoi attivare la scalabilità automatica predittiva per fare lo scale out prima del carico previsto. Per sapere se la scalabilità automatica predittiva è adatta al tuo workload, consulta Scalabilità basata sulle previsioni.

Puoi verificare che la scalabilità automatica sia stata attivata correttamente utilizzando il sottocomando instance-groups managed describe, che descrive il gruppo di istanze gestite corrispondente e fornisce informazioni su eventuali funzionalità di scalabilità automatica per quel gruppo di istanze:

gcloud compute instance-groups managed describe example-managed-instance-group

Per un elenco dei comandi e dei flag gcloud disponibili, consulta la documentazione di riferimento di gcloud.

REST

Per creare un gestore della scalabilità automatica, utilizza il metodo autoscalers.insert per un MIG a livello di zona o il metodo regionAutoscalers.insert per un MIG a livello di regione.

L'esempio seguente crea un gestore della scalabilità automatica per un MIG a livello di zona:

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/autoscalers

Il corpo della richiesta deve contenere i campi name, target e autoscalingPolicy. autoscalingPolicy deve definire cpuUtilization e maxNumReplicas.

Facoltativamente, imposta i seguenti campi per controllare la scalabilità automatica:

Puoi utilizzare il campo coolDownPeriodSec per impostare il periodo di inizializzazione, che indica al gestore della scalabilità automatica il tempo necessario per l'inizializzazione dell'applicazione. Specificando un periodo di inizializzazione preciso è possibile migliorare le decisioni del gestore della scalabilità automatica. Ad esempio, durante lo scale out, il gestore della scalabilità automatica ignora i dati provenienti dalle VM che sono ancora in fase di inizializzazione, perché potrebbero non rappresentare il normale utilizzo della tua applicazione. Il periodo di inizializzazione predefinito è di 60 secondi.
Puoi utilizzare il campo stabilizationPeriodSec per impostare il periodo di stabilizzazione, che determina la durata dello fare lo scale in del MIG. Un periodo di stabilizzazione più breve indica un'eliminazione più rapida delle VM per fare lo scale in. Il valore deve essere compreso tra `0` e `3600` secondi. Il valore predefinito è `600` secondi. Per saperne di più, consulta Best practice per il periodo di stabilizzazione.

{
  "name": "example-autoscaler",
  "target": "https://www.googleapis.com/compute/v1/projects/myproject/zones/us-central1-f/instanceGroupManagers/example-managed-instance-group",
  "autoscalingPolicy": {
    "maxNumReplicas": 10,
    "cpuUtilization": {
      "utilizationTarget": 0.6
    },
    "coolDownPeriodSec": 90,
    "stabilizationPeriodSec": 240
  }
}

Per ulteriori informazioni sull'attivazione della scalabilità automatica basata sull'utilizzo della CPU, completa il tutorial Utilizzo della scalabilità automatica per app altamente scalabili.

Come il gestore della scalabilità automatica gestisce un elevato utilizzo della CPU

Durante i periodi di elevato utilizzo della CPU, se l'utilizzo è vicino al 100%, il gestore della scalabilità automatica stima che il gruppo potrebbe essere già molto sovraccaricato. In questi casi, il gestore della scalabilità automatica aumenta il numero di macchine virtuali al massimo del 50%.

Passaggi successivi

Scopri come attivare la scalabilità automatica predittiva.
Scopri di più sull'organizzazione dei gestori della scalabilità automatica.
Scopri il processo decisionale dei gestori della scalabilità automatica.
Scopri come utilizzare più indicatori di scalabilità automatica per scalare il gruppo.

Scalabilità basata sull'utilizzo della CPU Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Prima di iniziare

Console

gcloud

REST

Scalabilità basata sull'utilizzo della CPU

Attiva la scalabilità automatica basata sull'utilizzo della CPU

Autorizzazioni richieste per questa attività

Console

gcloud

REST

Come il gestore della scalabilità automatica gestisce un elevato utilizzo della CPU

Passaggi successivi

Scalabilità basata sull'utilizzo della CPU