Monitorare le istanze con Cloud Monitoring

Questo documento descrive come utilizzare la console Cloud Monitoring per monitorare le istanze Spanner.

La console Cloud Monitoring fornisce diversi strumenti di monitoraggio per Spanner:

Se preferisci monitorare Spanner a livello di programmazione, utilizza le librerie client di Cloud per Cloud Monitoring per recuperare le metriche.

Utilizzare la dashboard curata di Cloud Monitoring

Cloud Monitoring fornisce una dashboard curata che riepiloga le informazioni chiave sulle istanze Spanner, tra cui:

  • Incidenti: avvisi di monitoraggio creati dagli utenti che sono aperti, attivi o risolti
  • Eventi: un elenco dei log di controllo di Spanner (se abilitati e disponibili)
  • Istanze: un riepilogo di alto livello delle tue istanze Spanner, inclusi capacità di calcolo, conteggio dei database e integrità dell'istanza
  • Grafici aggregati del throughput e dell'utilizzo dello spazio di archiviazione

Per visualizzare la dashboard di Spanner:

  1. Nella console Google Cloud , seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione viene visualizzato Risorse, seleziona Risorse e poi Cloud Spanner. In caso contrario, seleziona Dashboard e poi seleziona la dashboard denominata Cloud Spanner.

Visualizzare i dettagli dell'istanza e del database

Quando apri la dashboard curata per Spanner, vengono visualizzati i dati aggregati per tutte le tue istanze. Puoi visualizzare ulteriori dettagli su un'istanza specifica facendo clic sul nome dell'istanza in Istanze.

La dashboard mostra informazioni come i metadati dell'istanza, i database nell'istanza e grafici di varie metriche suddivise per regione.

Dalla pagina della dashboard dell'istanza, puoi anche visualizzare i grafici per un database specifico nell'istanza:

  1. Sul lato destro, sopra i grafici delle metriche dell'istanza, fai clic su Metriche del database.

  2. Nell'elenco a discesa Seleziona una distribuzione, seleziona il database che vuoi esaminare.

    La console Cloud Monitoring mostra i grafici per il database.

Creare grafici personalizzati per le metriche Spanner

Puoi utilizzare Cloud Monitoring per creare grafici personalizzati per le metriche di Spanner. Puoi utilizzare Metrics Explorer per creare grafici temporanei e ad hoc oppure puoi creare grafici che vengono visualizzati nelle dashboard personalizzate.

In particolare, Cloud Monitoring ti consente di creare un grafico personalizzato che mostra se due o più metriche sono correlate tra loro. Ad esempio, puoi verificare la correlazione tra utilizzo della CPU e latenza in un'istanza Spanner, il che potrebbe indicare che l'istanza ha bisogno di una maggiore capacità di calcolo o che alcune delle tue query causano un elevato utilizzo della CPU.

Per iniziare a utilizzare questo esempio, segui questi passaggi:

  1. Nella console Google Cloud , seleziona Monitoring o utilizza il pulsante seguente:

    Vai a Monitoring

  2. Se nel riquadro di navigazione è mostrato Esplora metriche, selezionalo. In caso contrario, seleziona Risorse e poi Esplora metriche.

  3. Fai clic sulla scheda Opzioni di visualizzazione, quindi seleziona la casella di controllo Scala logaritmica sull'asse Y. Questa opzione ti consente di confrontare più metriche quando una metrica ha valori molto più grandi delle altre.

  4. Nell'elenco a discesa sopra il riquadro di destra, seleziona Linea.

  5. Fai clic sulla scheda Metriche. Ora puoi aggiungere metriche al grafico.

Per aggiungere metriche di latenza al grafico:

  1. Nella casella Trova tipo di risorsa e metrica, inserisci il valore spanner.googleapis.com/api/request_latencies, quindi fai clic sulla riga che viene visualizzata sotto la casella.
  2. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  3. Nell'elenco a discesa Aggregatore, fai clic su max.
  4. (Facoltativo) Modifica il percentile di latenza:

    1. Fai clic su Mostra opzioni avanzate.
    2. Fai clic sull'elenco a discesa Allineatore, poi fai clic sul percentile di latenza che vuoi visualizzare.

    Nella maggior parte dei casi, devi esaminare la latenza del 50° percentile per comprendere la quantità tipica di latenza oppure la latenza del 99° percentile per comprendere la latenza per l'1% più lento delle richieste.

Per aggiungere le metriche di utilizzo della CPU al grafico:

  1. Fai clic su Aggiungi metrica.
  2. Nella casella Find resource type and metric (Trova tipo di risorsa e metrica), inserisci il valore spanner.googleapis.com/instance/cpu/utilization, quindi fai clic sulla riga che viene visualizzata sotto la casella.
  3. Nella casella Filtro, inserisci il valore instance_id, quindi inserisci l'ID istanza che vuoi esaminare e fai clic su Applica.
  4. Nell'elenco a discesa Aggregatore, fai clic su max.

Ora hai un grafico che mostra le metriche di utilizzo della CPU e latenza per un'istanza Spanner. Se entrambe le metriche sono superiori al previsto nello stesso momento, puoi intraprendere ulteriori passaggi per risolvere il problema.

Per saperne di più sulla creazione di grafici personalizzati, consulta la documentazione di Cloud Monitoring.

Crea avvisi per le metriche Spanner

Quando crei un'istanza Spanner, scegli la capacità di calcolo per l'istanza. Man mano che il workload dell'istanza cambia, Spanner non regola automaticamente la capacità di calcolo dell'istanza. Di conseguenza, devi configurare diversi avvisi per assicurarti che l'istanza rimanga entro i massimi consigliati per l'utilizzo della CPU e il limite consigliato per lo spazio di archiviazione.

I seguenti esempi mostrano come configurare criteri di avviso per alcune metriche Spanner. Per un elenco completo delle metriche disponibili, consulta l'elenco delle metriche per Spanner.

CPU ad alta priorità

Per creare un criterio di avviso che si attiva quando l'utilizzo della CPU ad alta priorità per Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU per priorità.

(metric.type è spanner.googleapis.com/instance/cpu/utilization_by_priority).
Filtro instance_id = YOUR_INSTANCE_ID
priority = high
Tra le serie temporali
Raggruppa serie temporali per
location per le istanze multiregionali;
lascia vuoto per le istanze regionali.
Tra le serie temporali
Aggregazione serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
Trigger avviso Any time series violates
Posizione soglia Above threshold
Valore soglia 45% per le istanze multiregionali;
65% per le istanze regionali.
Finestra di ripetizione test 10 minutes

Media mobile su 24 ore della CPU

Per creare un criterio di avviso che si attiva quando la media mobile di 24 ore dell'utilizzo della CPU per Spanner supera una soglia consigliata, utilizza le seguenti impostazioni.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Utilizzo CPU smussato.

(The metric.type is spanner.googleapis.com/instance/cpu/smoothed_utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Tra le serie temporali
Aggregazione serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua mean
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
Trigger avviso Any time series violates
Posizione soglia Above threshold
Soglia 90%
Finestra di ripetizione test 10 minutes

Spazio di archiviazione

Per creare un criterio di avviso che si attiva quando lo spazio di archiviazione per l'istanza Spanner supera una soglia consigliata, utilizza le impostazioni seguenti.

Nuova condizione
Campo

Valore
Risorsa e metrica Nel menu Risorse, seleziona Istanza Spanner.
Nel menu Categorie di metriche, seleziona Istanza.
Nel menu Metriche, seleziona Spazio di archiviazione utilizzato.

(The metric.type is spanner.googleapis.com/instance/storage/utilization).
Filtro instance_id = YOUR_INSTANCE_ID
Tra le serie temporali
Aggregazione serie temporali
sum
Finestra temporale continua 10 m
Funzione finestra temporale continua max
Campo Configura trigger di avviso

Valore
Tipo di condizione Threshold
La condizione si attiva se Any time series violates
Posizione soglia Above threshold
Valore soglia Non è necessario impostare una soglia specifica per lo spazio di archiviazione massimo per nodo. Tuttavia, ti consigliamo di configurare un avviso per quando ti avvicini al limite massimo di spazio di archiviazione. Per saperne di più, consulta Metriche di utilizzo dello spazio di archiviazione.
Finestra di ripetizione test 10 minutes

Passaggi successivi