Identificare i workload con provisioning insufficiente e con provisioning eccessivo

Questo documento spiega come identificare i carichi di lavoro con provisioning insufficiente ed eccessivo che vengono eseguiti sui cluster Google Kubernetes Engine (GKE) utilizzando approfondimenti e consigli. Dopo aver verificato che i carichi di lavoro identificati trarrebbero vantaggio dal consiglio di scalare verso l'alto o verso il basso, puoi apportare la modifica consigliata per risparmiare sui costi o aumentare l'affidabilità del tuo carico di lavoro. Se possibile, il consiglio include i risparmi o i costi mensili previsti. Per saperne di più, consulta Comprendere le stime di costi o risparmi.

GKE fornisce questi approfondimenti sui carichi di lavoro in esecuzione sui cluster Autopilot e Standard. GKE fornisce anche suggerimenti simili per interi cluster. Per maggiori informazioni, consulta Identificare i cluster GKE con provisioning insufficiente e con provisioning eccessivo.

GKE monitora i tuoi cluster e fornisce indicazioni per ottimizzare l'utilizzo tramite Active Assist, un servizio che fornisce motori per suggerimenti che generano approfondimenti e consigli per l'utilizzo delle risorse su Google Cloud. Per saperne di più su come gestire approfondimenti e suggerimenti, consulta Ottimizzare l'utilizzo di GKE con approfondimenti e suggerimenti.

Visualizzare approfondimenti e consigli per i workload con provisioning insufficiente ed eccessivo

GKE mostra questi approfondimenti e suggerimenti nelle seguenti posizioni della console Google Cloud dopo aver osservato il comportamento specifico descritto nella sezione seguente:

I suggerimenti hanno i seguenti titoli nella pagina Workload:

  • Workload con provisioning eccessivo: "Diminuisci le richieste di risorse per ridurre i costi"
  • Workload con provisioning insufficiente: "Aumenta le richieste di risorse per migliorare l'affidabilità"

Puoi anche ricevere tutti i tipi di approfondimenti e suggerimenti tramite Google Cloud CLI o l'API Recommender. Per trovare questi tipi in particolare, segui le istruzioni per visualizzare approfondimenti e suggerimenti e filtra utilizzando i sottotipi WORKLOAD_UNDERPROVISIONED e WORKLOAD_OVERPROVISIONED.

Dopo aver identificato i carichi di lavoro con provisioning insufficiente o eccessivo, consulta le considerazioni da fare quando si esegue il rightsizing dei carichi di lavoro.

Come GKE identifica i workload con provisioning insufficiente e con provisioning eccessivo

La tabella seguente descrive i segnali utilizzati da GKE per identificare i workload con provisioning insufficiente e con provisioning eccessivo che possono essere scalati o ridotti e la soglia per ciascun segnale. Inoltre, questa tabella mostra l'azione che ti consigliamo di intraprendere in questo scenario.

Sottotipo Indicatore Periodo di osservazione Dettagli Suggerimento
WORKLOAD_UNDERPROVISIONED L'utilizzo di CPU o memoria è elevato Ultimi 15 giorni Un workload è sottoprovvigionato quando l'utilizzo di CPU o memoria è superiore al 150% per almeno il 10% del tempo negli ultimi 15 giorni. Aumenta le dimensioni del workload per migliorare l'affidabilità
WORKLOAD_OVERPROVISIONED L'utilizzo di CPU o memoria è basso Ultimi 15 giorni Un workload è sottoposto a overprovisioning quando l'utilizzo di CPU o memoria è inferiore al 50% per almeno il 90% del tempo negli ultimi 15 giorni. Ridurre le dimensioni del workload per risparmiare sui costi

GKE utilizza anche le seguenti linee guida per determinare quando fornire approfondimenti e consigli:

  • GKE non genera consigli per la metrica target della scalabilità automatica orizzontale dei pod (HPA) perché l'utilizzo di questa metrica può causare interferenze.
  • Se la scalabilità automatica pod verticale (VPA) è abilitata, i valori delle richieste vengono gestiti automaticamente e GKE non deve generare un consiglio.
  • GKE potrebbe attendere fino a tre giorni prima di generare consigli per i nuovi carichi di lavoro.

Informazioni sulle stime dei costi o dei risparmi

Se possibile, il consiglio di GKE include una stima che proietta il costo o il risparmio mensile se dimensionassi correttamente il carico di lavoro. Questa stima deriva dai costi del workload, in base alla media ponderata dei valori delle richieste combinati con il costo di CPU e memoria del workload negli ultimi 30 giorni.

Gli eventuali costi o risparmi stimati sono proiezioni basate su spese precedenti e non sono una garanzia di costi o risparmi futuri.

Per visualizzare queste stime, assicurati che siano soddisfatte le seguenti condizioni:

Per saperne di più sul costo di tutti i tuoi cluster GKE, inclusa una suddivisione più granulare in base a spazi dei nomi e carichi di lavoro, consulta Ottenere informazioni chiave sulla spesa per l'allocazione delle risorse GKE e i costi dei cluster.

Per saperne di più sui costi di esecuzione di un cluster GKE, consulta Prezzi di GKE.

Considerazioni sul dimensionamento corretto dei workload

Prima di seguire un consiglio per aumentare o ridurre le dimensioni di un workload, tieni presente quanto segue:

  • Esamina l'utilizzo delle risorse del workload per vedere il suo rendimento e se utilizza più o meno CPU e memoria del previsto. Per istruzioni, vedi Analizzare le richieste di risorse.
  • I carichi di lavoro di elaborazione batch potrebbero mantenere intenzionalmente un utilizzo elevato per ridurre i costi. Se le risorse allocate sono sufficienti per i job batch, non devi scalare il workload con utilizzo elevato, che è stato identificato come sottoprovisioning.
  • GKE ha una visibilità limitata sull'utilizzo effettivo della memoria dei workload basati sulla Java Virtual Machine (JVM). Presta particolare attenzione prima di applicare i suggerimenti per questi tipi di workload.

Implementa il consiglio per dimensionare correttamente un workload

Puoi modificare le dimensioni di un workload per adattarle meglio all'utilizzo delle risorse del workload effettuando una delle seguenti operazioni:

  • Abilita la scalabilità automatica pod verticale per il carico di lavoro. Per saperne di più, consulta Impostare automaticamente le richieste di risorse dei pod.
  • Modifica manualmente le richieste e i limiti in base al suggerimento:

    • Workload con provisioning insufficiente: per implementare il consiglio di ridimensionare un workload con provisioning insufficiente, aumenta le richieste e i limiti delle risorse per il workload. Quando implementi questo consiglio, contribuisci a garantire che il tuo workload rimanga affidabile perché dispone della quantità appropriata di risorse per le sue applicazioni.
    • Workload con provisioning eccessivo: per implementare il suggerimento di ridimensionamento di un workload con provisioning eccessivo, riduci le richieste e i limiti delle risorse per il workload. Regola le allocazioni di CPU e memoria del cluster in base alle esigenze del tuo workload. Quando implementi questo suggerimento, contribuisci a garantire di utilizzare solo le risorse necessarie per eseguire il workload.

Passaggi successivi