Identificare i workload con provisioning insufficiente e con provisioning eccessivo

Questo documento spiega come identificare i workload con provisioning insufficiente e con overprovisioning in esecuzione sui cluster Google Kubernetes Engine (GKE) utilizzando insight e suggerimenti. Dopo aver verificato che i workload identificati trarrebbero vantaggio dal suggerimento di fare lo scale up o lo scale down, puoi apportare la modifica consigliata per risparmiare sui costi o aumentare l'affidabilità del workload. Se possibile, il suggerimento include i risparmi o i costi mensili previsti. Per saperne di più, consulta Comprendere le stime dei costi o dei risparmi.

GKE fornisce questi insight sui workload in esecuzione sia sui cluster Autopilot che Standard. GKE fornisce anche suggerimenti simili per interi cluster. Per saperne di più, consulta Identificare i cluster GKE con provisioning insufficiente e con overprovisioning.

GKE monitora i cluster e fornisce indicazioni per ottimizzare l' utilizzo tramite Active Assist, un servizio che fornisce motori per suggerimenti che generano insight e suggerimenti per l'utilizzo delle risorse su Google Cloud. Per saperne di più su come gestire insight e suggerimenti, consulta Ottimizzare l'utilizzo di GKE con insight e suggerimenti.

Visualizzare insight e suggerimenti per i workload con provisioning insufficiente e con overprovisioning

Puoi ricevere questi insight e suggerimenti tramite Google Cloud CLI o l'API Recommender. Segui le istruzioni pertinenti per visualizzare insight e suggerimenti e filtrare utilizzando i sottotipi WORKLOAD_UNDERPROVISIONED e WORKLOAD_OVERPROVISIONED.

Dopo aver identificato i workload con provisioning insufficiente o con overprovisioning, consulta le considerazioni relative al dimensionamento corretto dei workload.

In che modo GKE identifica i workload con provisioning insufficiente e con overprovisioning

La tabella seguente descrive gli indicatori utilizzati da GKE per identificare i workload con provisioning insufficiente e con overprovisioning che possono essere scalati orizzontalmente o verticalmente e la soglia per ogni indicatore. Inoltre, questa tabella mostra l'azione che ti consigliamo di intraprendere in questo scenario.

Sottotipo Indicatore Periodo di osservazione Dettagli Suggerimento
WORKLOAD_UNDERPROVISIONED L'utilizzo di CPU o memoria utilizzata è elevato Ultimi 15 giorni Un workload ha un provisioning insufficiente quando l'utilizzo di CPU o memoria è superiore al 150% per almeno il 10% del tempo negli ultimi 15 giorni. Fare lo scale up del workload per aumentare l'affidabilità
WORKLOAD_OVERPROVISIONED L'utilizzo di CPU o memoria è basso Ultimi 15 giorni Un workload ha un overprovisioning quando l'utilizzo di CPU o memoria è inferiore al 50% per almeno il 90% del tempo negli ultimi 15 giorni. Fare lo scale down del workload per risparmiare sui costi

GKE utilizza anche le seguenti linee guida per determinare quando fornire insight e suggerimenti:

  • GKE non genera suggerimenti per la metrica target della scalabilità automatica orizzontale dei pod (HPA) perché l'utilizzo di questa metrica può causare interferenze.
  • Se la scalabilità automatica verticale dei pod (VPA) è abilitata, i valori delle richieste vengono gestiti automaticamente e GKE non deve generare un suggerimento.
  • GKE potrebbe attendere fino a tre giorni prima di generare suggerimenti per i nuovi workload.

Comprendere le stime dei costi o dei risparmi

Se possibile, il suggerimento di GKE include una stima che prevede il costo o il risparmio mensile se hai dimensionato correttamente il workload. Questa stima deriva dai costi del workload, in base alla media ponderata dei valori delle richieste combinati con il costo di CPU e memoria del workload negli ultimi 30 giorni.

I costi o i risparmi stimati sono proiezioni basate sulle spese precedenti e non sono una garanzia di costi o risparmi futuri.

Per visualizzare queste stime, assicurati che siano soddisfatte le seguenti condizioni:

Per saperne di più sul costo di tutti i cluster GKE, inclusa una suddivisione più granulare basata su spazi dei nomi e workload, consulta Ottenere insight chiave sulle spese per l'allocazione delle risorse e i costi dei cluster GKE.

Per saperne di più sui costi di esecuzione di un cluster GKE, consulta Prezzi di GKE.

Considerazioni relative al dimensionamento corretto dei workload

Prima di seguire un suggerimento per fare lo scale up o lo scale down di un workload, tieni presente quanto segue:

  • Esamina l'utilizzo delle risorse del workload per vedere come funziona e se utilizza più o meno CPU e memoria del previsto. Per le istruzioni, consulta Analizzare le richieste di risorse.
  • I workload di elaborazione batch potrebbero mantenere intenzionalmente un utilizzo elevato per l'efficienza dei costi. Se le risorse allocate sono sufficienti per i job batch, non è necessario fare lo scale up del workload con utilizzo elevato, che è stato identificato come con provisioning insufficiente.
  • GKE ha una visibilità limitata sull'utilizzo effettivo della memoria utilizzata dei workload basati su Java Virtual Machine (JVM). Esegui un'analisi più approfondita prima di applicare i suggerimenti per questi tipi di workload.

Implementare il suggerimento per dimensionare correttamente un workload

Puoi regolare le dimensioni di un workload in modo che corrispondano meglio all'utilizzo delle risorse del workload in uno dei seguenti modi:

  • Abilita la scalabilità automatica verticale dei pod per il workload. Per saperne di più, consulta Impostare automaticamente le richieste di risorse dei pod.
  • Modifica manualmente le richieste e i limiti manualmente in base al suggerimento:

    • Workload con provisioning insufficiente: per implementare il suggerimento di dimensionare correttamente un workload con provisioning insufficiente, aumenta le richieste e i limiti delle risorse per il workload. Quando implementi questo suggerimento, contribuisci a garantire che il tuo workload rimanga affidabile perché dispone della quantità appropriata di risorse per le sue applicazioni.
    • Workload con overprovisioning: per implementare il suggerimento di dimensionare correttamente un workload con overprovisioning, riduci le richieste e i limiti delle risorse per il workload. Regola le allocazioni di CPU e memoria del cluster in base alle esigenze dei workload. Quando implementi questo suggerimento, contribuisci a garantire che utilizzi solo le risorse necessarie per eseguire il workload.

Passaggi successivi