Questo documento spiega come identificare i carichi di lavoro con provisioning insufficiente ed eccessivo che vengono eseguiti sui cluster Google Kubernetes Engine (GKE) utilizzando approfondimenti e consigli. Dopo aver verificato che i carichi di lavoro identificati trarrebbero vantaggio dal consiglio di scalare verso l'alto o verso il basso, puoi apportare la modifica consigliata per risparmiare sui costi o aumentare l'affidabilità del carico di lavoro. Se possibile, il consiglio include i risparmi o i costi mensili previsti. Per saperne di più, consulta Comprendere le stime di costi o risparmi.
GKE fornisce questi approfondimenti sui carichi di lavoro in esecuzione sui cluster Autopilot e Standard. GKE fornisce anche suggerimenti simili per interi cluster. Per maggiori informazioni, consulta Identificare i cluster GKE con provisioning insufficiente e con provisioning eccessivo.
GKE monitora i tuoi cluster e fornisce indicazioni per ottimizzare l'utilizzo tramite Active Assist, un servizio che fornisce motori per suggerimenti che generano approfondimenti e consigli per l'utilizzo delle risorse su Google Cloud. Per ulteriori informazioni su come gestire approfondimenti e suggerimenti, consulta Ottimizzare l'utilizzo di GKE con approfondimenti e suggerimenti.
Visualizzare approfondimenti e consigli per i workload con provisioning insufficiente ed eccessivo
Puoi ricevere questi insight e suggerimenti tramite Google Cloud CLI o l'API Recommender. Segui le istruzioni per visualizzare approfondimenti e suggerimenti e filtrare utilizzando i sottotipi WORKLOAD_UNDERPROVISIONED e WORKLOAD_OVERPROVISIONED.
Dopo aver identificato i carichi di lavoro con provisioning insufficiente o eccessivo, consulta le considerazioni per il dimensionamento corretto dei carichi di lavoro.
Come GKE identifica i workload con provisioning insufficiente e con provisioning eccessivo
La tabella seguente descrive i segnali utilizzati da GKE per identificare i workload con provisioning insufficiente e eccessivo che possono essere scalati o ridotti e la soglia per ciascun segnale. Inoltre, questa tabella mostra l'azione che ti consigliamo di intraprendere in questo scenario.
| Sottotipo | Indicatore | Periodo di osservazione | Dettagli | Suggerimento |
|---|---|---|---|---|
WORKLOAD_UNDERPROVISIONED |
L'utilizzo di CPU o memoria è elevato | Ultimi 15 giorni | Un workload è sottoprovvigionato quando l'utilizzo di CPU o memoria è superiore al 150% per almeno il 10% del tempo negli ultimi 15 giorni. | Aumenta le dimensioni del workload per migliorare l'affidabilità |
WORKLOAD_OVERPROVISIONED |
L'utilizzo di CPU o memoria è basso | Ultimi 15 giorni | Un workload è sottoposto a overprovisioning quando l'utilizzo di CPU o memoria è inferiore al 50% per almeno il 90% del tempo negli ultimi 15 giorni. | Ridurre le dimensioni del workload per risparmiare sui costi |
GKE utilizza anche le seguenti linee guida per determinare quando fornire approfondimenti e consigli:
- GKE non genera consigli per la metrica target della scalabilità automatica orizzontale dei pod (HPA) perché l'utilizzo di questa metrica può causare interferenze.
- Se la scalabilità automatica pod verticale (VPA) è abilitata, i valori delle richieste vengono gestiti automaticamente e GKE non deve generare un consiglio.
- GKE potrebbe attendere fino a tre giorni prima di generare consigli per i nuovi carichi di lavoro.
Informazioni sulle stime dei costi o dei risparmi
Se possibile, il consiglio di GKE include una stima che proietta il costo o il risparmio mensile se ridimensioni il carico di lavoro. Questa stima deriva dai costi del workload, in base alla media ponderata dei valori delle richieste combinati con il costo di CPU e memoria del workload negli ultimi 30 giorni.
Gli eventuali costi o risparmi stimati sono proiezioni basate su spese precedenti e non sono una garanzia di costi o risparmi futuri.
Per visualizzare queste stime, assicurati che siano soddisfatte le seguenti condizioni:
- Disponi dell'autorizzazione
billing.accounts.getSpendingInformationrichiesta per ottenere informazioni sulla spesa. Per saperne di più, consulta Accesso alla fatturazione Cloud. - L'allocazione dei costi di GKE è abilitata per il cluster. Per maggiori informazioni, vedi Abilitare l'allocazione dei costi di GKE.
Per saperne di più sul costo di tutti i tuoi cluster GKE, inclusa una suddivisione più granulare in base a spazi dei nomi e carichi di lavoro, consulta Ottenere informazioni chiave sulla spesa per l'allocazione delle risorse GKE e i costi dei cluster.
Per saperne di più sui costi di esecuzione di un cluster GKE, consulta Prezzi di GKE.
Considerazioni sul dimensionamento corretto dei workload
Prima di seguire un consiglio per scalare orizzontalmente o verticalmente un workload, tieni presente quanto segue:
- Esamina l'utilizzo delle risorse del workload per vedere il suo rendimento e se utilizza più o meno CPU e memoria del previsto. Per istruzioni, vedi Analizzare le richieste di risorse.
- I carichi di lavoro di elaborazione batch potrebbero mantenere intenzionalmente un utilizzo elevato per efficienza dei costi. Se le risorse allocate sono sufficienti per i job batch, non devi scalare il workload con utilizzo elevato, che è stato identificato come sottoprovisioning.
- GKE ha una visibilità limitata sull'utilizzo effettivo della memoria dei carichi di lavoro basati sulla Java Virtual Machine (JVM). Presta particolare attenzione prima di applicare i suggerimenti per questi tipi di workload.
Implementa il consiglio per dimensionare correttamente un workload
Puoi modificare le dimensioni di un workload per adattarle meglio all'utilizzo delle risorse del workload in uno dei seguenti modi:
- Abilita la scalabilità automatica pod verticale per il carico di lavoro. Per saperne di più, consulta Impostare automaticamente le richieste di risorse dei pod.
Modifica manualmente le richieste e i limiti in base al suggerimento:
- Workload con provisioning insufficiente: per implementare il consiglio di ridimensionare un workload con provisioning insufficiente, aumenta le richieste e i limiti delle risorse per il workload. Se implementi questo consiglio, contribuisci a garantire l'affidabilità del tuo workload perché dispone della quantità appropriata di risorse per le sue applicazioni.
- Workload con provisioning eccessivo: per implementare il suggerimento di ridimensionamento di un workload con provisioning eccessivo, riduci le richieste e i limiti delle risorse per il workload. Regola le allocazioni di CPU e memoria del cluster in base alle esigenze del workload. Quando implementi questo suggerimento, contribuisci a garantire di utilizzare solo le risorse necessarie per eseguire il workload.
Passaggi successivi
- Visualizzare le metriche di ottimizzazione relative ai costi
- Riduzione dei costi mediante lo scale down dei cluster GKE durante le ore non di punta
- Ottimizza l'utilizzo di GKE con approfondimenti e consigli
- Best practice per l'esecuzione di applicazioni Kubernetes con ottimizzazione dei costi su GKE
- 5 funzionalità di GKE per ottimizzare i tuoi cluster