Utilizzare PromQL per creare criteri di avviso

Questa pagina descrive come creare criteri di avviso basati su PromQL in Cloud Monitoring. Puoi utilizzare le query PromQL per creare condizioni complesse con funzionalità come rapporti, soglie dinamiche basate su una metrica diversa e metriche combinate. Puoi anche configurare criteri di avviso basati su PromQL per operare su dati di oltre due anni.

Se utilizzi Prometheus in ambienti esterni a Google Cloud, o se utilizzi gli avvisi in Managed Service per Prometheus, puoi eseguire la migrazione delle regole di avviso di Prometheus alle policy di avviso basate su PromQL. In questo modo, puoi gestire tutte le tue policy di avviso in Cloud Monitoring.

Puoi anche importare le dashboard Grafana in Cloud Monitoring.

Utilizza PromQL nelle policy di avviso di Cloud Monitoring

Puoi creare criteri di avviso basati su PromQL nei seguenti modi:

Gli incidenti creati da una criterio di avviso basata su PromQL vengono visualizzati nella console Google Cloud insieme agli altri incidenti. Puoi interagire con questi incidenti nella console Google Cloud .

Le condizioni del criterio di avviso basato su PromQL possono fare riferimento a qualsiasi metrica in Cloud Monitoring, incluse le metriche di sistema, le metriche personalizzate e basate su log e le metriche di Prometheus. Google Cloud Devi tradurre i nomi delle metriche non Prometheus nella sintassi delle metriche PromQL. Per saperne di più, consulta Mappare le metriche di Monitoring a PromQL.

Eseguire query su oltre due anni di dati delle metriche

A differenza di altri tipi di criterio di avviso che supportano solo query su 25 ore di dati delle metriche, puoi utilizzare PromQL per generare avvisi su un massimo di 2 anni di dati delle metriche. Ciò supporta casi d'uso come:

  • Rilevamento di anomalie confrontando gli ultimi 5 minuti con lo stesso periodo di 5 minuti di una settimana fa.
  • Esecuzione di un criterio di avviso per burn rate lento di 7 giorni.
  • Calcolo del valore medio nell'ultimo mese e avviso se l'ora più recente di dati si discosta di più di tre deviazioni standard da questa media.
  • Utilizzando la funzione predict_linear sugli ultimi sette giorni di dati per vedere se supererai una soglia il giorno successivo.

I criteri di avviso PromQL che operano sulle 25 ore di dati più recenti, come definito dalla somma del periodo di allineamento e di qualsiasi spostamento temporale causato dall'utilizzo del modificatore offset, possono essere valutati con una frequenza di 30 secondi. I criteri che operano su dati meno recenti vengono valutati con minore frequenza, con il periodo minimo determinato dal periodo di tempo a cui si riferiscono icriterio di avvisoo:

Intervallo di ricerca della query Intervallo di valutazione minimo (predefinito)
Fino a 25 ore1 30 secondi
Da 25 ore a 8 giorni 5 minuti
Da 8 a 16 giorni 1 ora
Da 16 a 32 giorni 2 ore
Da 32 a 93 giorni 6 ore
Da 93 giorni a 2 anni 12 ore

1 Alcune metriche dei servizi Google Cloud supportano solo intervalli di valutazione di 30 secondi per un massimo di 23 ore e 30 minuti.

Assicurati di impostare le durate di rate in modo che siano almeno pari all'intervallo di valutazione, in modo che la criterio di avviso non perda dati. Ad esempio, se l'intervallo di valutazione è di 1 ora, la query dovrebbe essere simile a rate(metric[1h]).

Le condizioni che operano su più di 25 ore di dati hanno un termine per la query di 2 minuti, che corrisponde al termine in Metrics Explorer. Se la query PromQL non va in timeout inMetrics Explorere, non andrà in timeout nell'avviso.

Le norme di avviso PromQL sono molto più affidabili se vengono utilizzate sui dati delle ultime 25 ore. Per la massima affidabilità, assicurati che la somma della finestra di ripetizione del test, del periodo di allineamento e di qualsiasi spostamento temporale causato dall'utilizzo del modificatore offset sia al massimo di 25 ore.

Le finestre di nuovo test sono disattivate per le query di avviso PromQL che accedono a dati più vecchi di 25 ore.

Puoi inviare avvisi solo per le 25 ore più recenti di dati per le metriche personalizzate (il prefisso custom.googleapis.com) e le metriche basate sui log definite dall'utente (il prefisso logging.googleapis.com/user/).

Limitazioni

Non aggiungere filtri che utilizzano etichette di metadati di sistema ai criteri di avviso basati su PromQL.

Un criterio di avviso basato su PromQL può avere una finestra di nuovo test di al massimo 24 ore. Se utilizzi una finestra di ripetizione del test, la somma della finestra di ripetizione del test, del periodo di allineamento e di qualsiasi spostamento temporale causato dall'utilizzo del modificatore offset deve essere al massimo di 25 ore.

Se la regola di avviso di Prometheus fa riferimento a una metrica, devi prima disporre di un descrittore della metrica equivalente in Cloud Monitoring prima di creare la criterio di avviso basata su PromQL. Tuttavia, puoi ignorare questa convalida configurando la criterio di avviso basata su PromQL con l'API Cloud Monitoring. Per saperne di più, consulta Disattivare il controllo dell'esistenza delle metriche.

Se la criterio di avviso monitora un rapporto tra metriche, imposta la durata su almeno il doppio dell'intervallo di valutazione. Durate più brevi possono causare falsi incidenti. Per ulteriori informazioni, vedi Avvisi errati dovuti ad anomalie nel calcolo del rapporto.

Prezzi

Per informazioni sui prezzi di Cloud Monitoring, consulta la pagina Prezzi di Google Cloud Observability.