Questo documento spiega come identificare i workload con provisioning insufficiente e con overprovisioning in esecuzione sui cluster Google Kubernetes Engine (GKE) utilizzando insight e suggerimenti. Dopo aver verificato che i workload identificati trarrebbero vantaggio dal suggerimento di fare lo scale up o lo scale down, puoi apportare la modifica consigliata per risparmiare sui costi o aumentare l'affidabilità del workload. Se possibile, il suggerimento include i risparmi o i costi mensili previsti. Per saperne di più, consulta Comprendere le stime dei costi o dei risparmi.
GKE fornisce questi insight sui workload in esecuzione sia sui cluster Autopilot che Standard. GKE fornisce anche suggerimenti simili per interi cluster. Per saperne di più, consulta Identificare i cluster GKE con provisioning insufficiente e con overprovisioning.
GKE monitora i cluster e fornisce indicazioni per ottimizzare l' utilizzo tramite Active Assist, un servizio che fornisce motori per suggerimenti che generano insight e suggerimenti per l'utilizzo delle risorse su Google Cloud. Per saperne di più su come gestire insight e suggerimenti, consulta Ottimizzare l'utilizzo di GKE con insight e suggerimenti.
Visualizzare insight e suggerimenti per i workload con provisioning insufficiente e con overprovisioning
Puoi ricevere questi insight e suggerimenti tramite Google Cloud CLI o l'API Recommender. Segui le istruzioni pertinenti per visualizzare insight
e
suggerimenti
e filtrare utilizzando i sottotipi WORKLOAD_UNDERPROVISIONED e WORKLOAD_OVERPROVISIONED.
Dopo aver identificato i workload con provisioning insufficiente o con overprovisioning, consulta le considerazioni relative al dimensionamento corretto dei workload.
In che modo GKE identifica i workload con provisioning insufficiente e con overprovisioning
La tabella seguente descrive gli indicatori utilizzati da GKE per identificare i workload con provisioning insufficiente e con overprovisioning che possono essere scalati orizzontalmente o verticalmente e la soglia per ogni indicatore. Inoltre, questa tabella mostra l'azione che ti consigliamo di intraprendere in questo scenario.
| Sottotipo | Indicatore | Periodo di osservazione | Dettagli | Suggerimento |
|---|---|---|---|---|
WORKLOAD_UNDERPROVISIONED |
L'utilizzo di CPU o memoria utilizzata è elevato | Ultimi 15 giorni | Un workload ha un provisioning insufficiente quando l'utilizzo di CPU o memoria è superiore al 150% per almeno il 10% del tempo negli ultimi 15 giorni. | Fare lo scale up del workload per aumentare l'affidabilità |
WORKLOAD_OVERPROVISIONED |
L'utilizzo di CPU o memoria è basso | Ultimi 15 giorni | Un workload ha un overprovisioning quando l'utilizzo di CPU o memoria è inferiore al 50% per almeno il 90% del tempo negli ultimi 15 giorni. | Fare lo scale down del workload per risparmiare sui costi |
GKE utilizza anche le seguenti linee guida per determinare quando fornire insight e suggerimenti:
- GKE non genera suggerimenti per la metrica target della scalabilità automatica orizzontale dei pod (HPA) perché l'utilizzo di questa metrica può causare interferenze.
- Se la scalabilità automatica verticale dei pod (VPA) è abilitata, i valori delle richieste vengono gestiti automaticamente e GKE non deve generare un suggerimento.
- GKE potrebbe attendere fino a tre giorni prima di generare suggerimenti per i nuovi workload.
Comprendere le stime dei costi o dei risparmi
Se possibile, il suggerimento di GKE include una stima che prevede il costo o il risparmio mensile se hai dimensionato correttamente il workload. Questa stima deriva dai costi del workload, in base alla media ponderata dei valori delle richieste combinati con il costo di CPU e memoria del workload negli ultimi 30 giorni.
I costi o i risparmi stimati sono proiezioni basate sulle spese precedenti e non sono una garanzia di costi o risparmi futuri.
Per visualizzare queste stime, assicurati che siano soddisfatte le seguenti condizioni:
- Disponi dell'autorizzazione
billing.accounts.getSpendingInformationrichiesta per ottenere informazioni sulle spese. Per saperne di più, consulta Accesso alla fatturazione Cloud. - L'allocazione dei costi di GKE è abilitata per il cluster. Per saperne di più, consulta Abilitare l'allocazione dei costi di GKE.
Per saperne di più sul costo di tutti i cluster GKE, inclusa una suddivisione più granulare basata su spazi dei nomi e workload, consulta Ottenere insight chiave sulle spese per l'allocazione delle risorse e i costi dei cluster GKE.
Per saperne di più sui costi di esecuzione di un cluster GKE, consulta Prezzi di GKE.
Considerazioni relative al dimensionamento corretto dei workload
Prima di seguire un suggerimento per fare lo scale up o lo scale down di un workload, tieni presente quanto segue:
- Esamina l'utilizzo delle risorse del workload per vedere come funziona e se utilizza più o meno CPU e memoria del previsto. Per le istruzioni, consulta Analizzare le richieste di risorse.
- I workload di elaborazione batch potrebbero mantenere intenzionalmente un utilizzo elevato per l'efficienza dei costi. Se le risorse allocate sono sufficienti per i job batch, non è necessario fare lo scale up del workload con utilizzo elevato, che è stato identificato come con provisioning insufficiente.
- GKE ha una visibilità limitata sull'utilizzo effettivo della memoria utilizzata dei workload basati su Java Virtual Machine (JVM). Esegui un'analisi più approfondita prima di applicare i suggerimenti per questi tipi di workload.
Implementare il suggerimento per dimensionare correttamente un workload
Puoi regolare le dimensioni di un workload in modo che corrispondano meglio all'utilizzo delle risorse del workload in uno dei seguenti modi:
- Abilita la scalabilità automatica verticale dei pod per il workload. Per saperne di più, consulta Impostare automaticamente le richieste di risorse dei pod.
Modifica manualmente le richieste e i limiti manualmente in base al suggerimento:
- Workload con provisioning insufficiente: per implementare il suggerimento di dimensionare correttamente un workload con provisioning insufficiente, aumenta le richieste e i limiti delle risorse per il workload. Quando implementi questo suggerimento, contribuisci a garantire che il tuo workload rimanga affidabile perché dispone della quantità appropriata di risorse per le sue applicazioni.
- Workload con overprovisioning: per implementare il suggerimento di dimensionare correttamente un workload con overprovisioning, riduci le richieste e i limiti delle risorse per il workload. Regola le allocazioni di CPU e memoria del cluster in base alle esigenze dei workload. Quando implementi questo suggerimento, contribuisci a garantire che utilizzi solo le risorse necessarie per eseguire il workload.
Passaggi successivi
- Visualizzazione delle metriche di ottimizzazione relative ai costi
- Riduzione dei costi mediante la scalabilità verticale dei cluster GKE durante le ore non di punta
- Ottimizzare l'utilizzo di GKE con insight e suggerimenti
- Best practice per l'esecuzione di applicazioni Kubernetes con ottimizzazione dei costi su GKE
- 5 funzionalità di GKE per aiutarti a ottimizzare i cluster