Incidenti per i criteri di avviso basati su metriche

Un incidente è un record di quando vengono soddisfatte le condizioni di un criterio di avviso. Se un criterio di avviso contiene più condizioni, il criterio di avviso specifica se il soddisfacimento di una condizione è sufficiente per causare la creazione di un incidente. In genere, quando le condizioni sono soddisfatte, Cloud Monitoring apre un incidente e invia una notifica. Tuttavia, gli incidenti non vengono creati nelle seguenti circostanze:

Per ogni incidente, Monitoring crea una pagina Dettagli incidente che ti consente di gestire l'incidente e che riporta le informazioni sull'incidente che possono aiutarti a risolvere il problema. Ad esempio, la pagina Dettagli incidente mostra la cronologia dell'incidente e un grafico che mostra i dati delle metriche monitorate. Puoi anche trovare link a incidenti ed voci di log correlati.

Questo documento descrive come trovare gli incident. Descrive inoltre come utilizzare la pagina Dettagli incidente per gestire gli incidenti per le policy di avviso basate su metriche, che valutano i dati delle serie temporali archiviati da Cloud Monitoring.

Questa funzionalità è supportata solo per i Google Cloud progetti. Per le configurazioni di App Hub, seleziona il progetto host di App Hub o il progetto di gestione.

Prima di iniziare

Per ottenere le autorizzazioni necessarie per visualizzare e gestire gli incidenti, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Per saperne di più sui ruoli di Cloud Monitoring, consulta Controllare l'accesso con Identity and Access Management.

Visualizza incidenti

Per visualizzare gli incidenti nel tuo progetto, utilizza la console Google Cloud , gcloud CLI (anteprima pubblica) o l'API Monitoring (anteprima pubblica).

Console Google Cloud

Per elencare gli incidenti nel tuo Google Cloud progetto:

  1. Nella Google Cloud console, vai alla pagina  Avvisi:

    Vai ad Avvisi

    Se utilizzi la barra di ricerca per trovare questa pagina, seleziona il risultato con il sottotitolo Monitoring.

  2. Nella barra degli strumenti della console Google Cloud , seleziona il tuo progetto Google Cloud . Per le configurazioni di App Hub, seleziona il progetto host di App Hub o il progetto di gestione.

    La pagina Avvisi mostra informazioni su policy di avviso, posticipi e incidenti:

    • Il riquadro Riepilogo elenca il numero di incidenti aperti.
    • La tabella Incidenti mostra gli incidenti aperti più recenti. Per elencare gli incidenti più recenti nella tabella, inclusi quelli chiusi, fai clic su Mostra incidenti chiusi.
  3. Per visualizzare i dettagli di un incidente specifico, selezionalo nell'elenco.

    Viene visualizzata la pagina Dettagli incidente. Per ulteriori informazioni sulla pagina Dettagli incidente, consulta la sezione Esaminare un incidente di questo documento.

Trovare incidenti meno recenti

La tabella Incidenti nella pagina Avvisi mostra gli incidenti aperti più recenti. Per visualizzare gli incidenti meno recenti, esegui una delle seguenti operazioni:

  • Per scorrere le voci nella tabella Incidenti, fai clic su  Più recenti o  Meno recenti.

  • Per aprire una pagina che ti consente di elencare e filtrare gli incidenti, fai clic su Visualizza tutti gli incidenti. Viene visualizzata la pagina Incidenti. Da questa pagina, segui questi passaggi:

    • Mostra tutti gli incidenti, inclusi quelli chiusi. Per visualizzare tutti gli incidenti, fai clic su Mostra incidenti chiusi.
    • Filtra incidenti. Per informazioni sull'aggiunta di filtri, vedi Filtrare gli incidenti.
    • Conferma o chiudi un incidente oppure posticipa il criterio di avviso. Per accedere a queste opzioni, fai clic su  Altre opzioni nella riga dell'incidente e fai una selezione dal menu. Per saperne di più, consulta Gestire gli incidenti.

Filtra incidenti

Per limitare gli incidenti visualizzati nella tabella, aggiungi filtri. Se aggiungi più filtri, la tabella mostra solo gli incidenti che soddisfano tutti i filtri.

Per filtrare la tabella degli incidenti:

  1. Nella pagina Incidenti, fai clic su  Filtra tabella e poi seleziona una proprietà del filtro. Le proprietà di filtro includono:

    • Stato dell'incidente
    • Nome del criterio di avviso
    • Quando è stato aperto o chiuso l'incidente
    • Tipo di metrica
    • Tipo di risorsa
  2. Seleziona un valore dal menu secondario o inseriscilo nella barra dei filtri.

    Ad esempio, se selezioni Tipo di metrica e inserisci usage_time, allora potresti visualizzare solo le seguenti opzioni nel menu secondario:

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time
    

    La tabella Incidenti elenca quindi il filtro.

gcloud

Puoi utilizzare gcloud per ottenere e elencare gli incidenti.

Recupera incidente

Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:

  • ALERT_NAME: il nome della risorsa dell'avviso. Ad esempio, projects/my-project/alerts/my-alert-id.

Esegui il comando gcloud alpha monitoring alerts describe:

Linux, macOS o Cloud Shell

gcloud alpha monitoring alerts describe ALERT_NAME

Windows (PowerShell)

gcloud alpha monitoring alerts describe ALERT_NAME

Windows (cmd.exe)

gcloud alpha monitoring alerts describe ALERT_NAME
Il comando restituisce una risposta con i dettagli dell'avviso, ad esempio lo stato dell'avviso, le etichette allegate e la criterio di avviso di origine. Tieni presente che le etichette nella risposta sono soggette a modifiche durante l'anteprima di questa funzionalità. La risposta è simile alla seguente:
{
  "name": "projects/my-project/alerts/my-alert-id1",
  "state": "OPEN",
  "open_time": "2025-06-11T09:53:46Z",
  "close_time": "2025-06-13T10:11:36Z",
  "resource": {
    "type": "gce_instance",
    "labels": {
      "zone": "us-west1",
      "instance_id": "123456789",
      "project_id": "my-project"
    }
  },
  "metric": {
    "labels": {
      "instance_name": "my-instance1"
    },
    "type": "compute.googleapis.com/instance/cpu/usage_time"
  },
  "policy": {
    "name": "projects/my-project/alertPolicies/POLICY_1",
    "displayName": "my-policy"
  },
  "summaryText": "[ALERT] VM Instance - CPU usage on my-project my-instance1"
}

Elenca incidenti

Puoi elencare gli incidenti nel tuo progetto e filtrare i risultati utilizzando gcloud CLI.

Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:

  • PROJECT_ID: l'identificatore del progetto.

Esegui il comando gcloud alpha monitoring alerts list:

Linux, macOS o Cloud Shell

gcloud alpha monitoring alerts list

Windows (PowerShell)

gcloud alpha monitoring alerts list

Windows (cmd.exe)

gcloud alpha monitoring alerts list
Il comando restituisce una risposta con i dettagli dell'avviso, ad esempio lo stato dell'avviso, le etichette allegate e la criterio di avviso di origine. Tieni presente che le etichette nella risposta sono soggette a modifiche durante l'anteprima di questa funzionalità. La risposta è simile alla seguente:
{
  "alerts": [
    {
      "name": "projects/my-project/alerts/my-alert-id1",
      "state": "OPEN",
      "open_time": "2025-06-11T09:53:46Z",
      "close_time": "2025-06-13T10:11:36Z",
      "resource": {
        "type": "gce_instance",
        "labels": {
          "zone": "us-west1",
          "instance_id": "123456789",
          "project_id": "my-project"
        }
      },
      "metric": {
        "labels": {
          "instance_name": "my-instance1"
        },
        "type": "compute.googleapis.com/instance/cpu/usage_time"
      },
      "policy": {
        "name": "projects/my-project/alertPolicies/POLICY_1",
        "displayName": "my-policy"
      },
      "summaryText": "[ALERT] VM Instance - CPU usage on my-project my-instance1"
    }
  ]
}
Puoi anche utilizzare i seguenti flag facoltativi per filtrare, ordinare o modificare l'output:
  • --filter: fornisci un'espressione di filtro per filtrare gli avvisi in base all'ora o all'etichetta. Ad esempio, filtra per ora con --filter='close_time>="2025-09-10T00:00:00Z"' o per etichetta con --filter='resource.labels.key="value"'.

  • --sort-by: un elenco separato da virgole dei campi in base a cui ordinare l'output. Ad esempio: --sort-by=open_time.

  • --uri: il comando restituisce un elenco di URI delle risorse anziché l'output predefinito.

  • --limit: imposta questo flag su 2 o su un valore superiore per limitare il numero di avvisi restituiti. Non utilizzare questo flag insieme al flag --filter.

API Monitoring

Puoi utilizzare l'API Monitoring per ottenere incidenti ed elenchi di incidenti.

Recupera incidente

Per ottenere dettagli su un singolo incidente con l'API Monitoring, utilizza il metodo alerts.get.

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

  • PROJECT_ID: l'identificatore del progetto.
  • ALERT_ID: l'ID dell'avviso.

Metodo HTTP e URL:

GET https://monitoring.googleapis.com/v3/projects/PROJECT_ID/alerts/ALERT_ID

Per inviare la richiesta, espandi una di queste opzioni:

Il comando restituisce una risposta con i dettagli dell'avviso, ad esempio lo stato dell'avviso, le etichette allegate e la criterio di avviso di origine. Tieni presente che le etichette nella risposta sono soggette a modifiche durante l'anteprima di questa funzionalità. La risposta è simile alla seguente:
{
  "name": "projects/my-project/alerts/my-alert-id1",
  "state": "OPEN",
  "open_time": "2025-06-11T09:53:46Z",
  "close_time": "2025-06-13T10:11:36Z",
  "resource": {
    "type": "gce_instance",
    "labels": {
      "zone": "us-west1",
      "instance_id": "123456789",
      "project_id": "my-project"
    }
  },
  "metric": {
    "labels": {
      "instance_name": "my-instance1"
    },
    "type": "compute.googleapis.com/instance/cpu/usage_time"
  },
  "policy": {
    "name": "projects/my-project/alertPolicies/POLICY_1",
    "displayName": "my-policy"
  },
  "summaryText": "[ALERT] VM Instance - CPU usage on my-project my-instance1"
}

Elenca incidenti

Per elencare gli incidenti nel tuo progetto e filtrare i risultati con l'API Monitoring, utilizza il metodo alerts.list.

Prima di utilizzare i dati della richiesta, apporta le sostituzioni seguenti:

  • PROJECT_ID: l'identificatore del progetto.

Metodo HTTP e URL:

GET https://monitoring.googleapis.com/v3/projects/PROJECT_ID/alerts

Per inviare la richiesta, espandi una di queste opzioni:

Il comando restituisce una risposta con i dettagli dell'avviso, ad esempio lo stato dell'avviso, le etichette allegate e la criterio di avviso di origine. Tieni presente che le etichette nella risposta sono soggette a modifiche durante l'anteprima di questa funzionalità. La risposta è simile alla seguente:
{
  "alerts": [
    {
      "name": "projects/my-project/alerts/my-alert-id1",
      "state": "OPEN",
      "open_time": "2025-06-11T09:53:46Z",
      "close_time": "2025-06-13T10:11:36Z",
      "resource": {
        "type": "gce_instance",
        "labels": {
          "zone": "us-west1",
          "instance_id": "123456789",
          "project_id": "my-project"
        }
      },
      "metric": {
        "labels": {
          "instance_name": "my-instance1"
        },
        "type": "compute.googleapis.com/instance/cpu/usage_time"
      },
      "policy": {
        "name": "projects/my-project/alertPolicies/POLICY_1",
        "displayName": "my-policy"
      },
      "summaryText": "[ALERT] VM Instance - CPU usage on my-project my-instance1"
    }
  ]
}
Gli utenti di Curl possono aggiungere il flag --data-urlencode seguito da un'espressione di filtro per filtrare gli avvisi in base all'ora o all'etichetta. Vedi i seguenti esempi:

Elenca gli avvisi aperti nell'ultima ora:

--data-urlencode "filter=(open_time>=\"`date -u -d "1 hour ago" +"%Y-%m-%dT%H:%M:%SZ"`\")"

Elenca e filtra gli avvisi aperti dell'ultimo giorno:

--data-urlencode "filter=(open_time>=\"`date -u -d "1 DAY ago" +"%Y-%m-%dT%H:%M:%SZ"`\" AND state=open)"

Elenca e filtra gli avvisi aperti tra due periodi:

--data-urlencode "filter=(open_time>=\"`date -u -d "2 DAY ago" +"%Y-%m-%dT%H:%M:%SZ"`\" AND open_time<=\"`date -u -d "1 DAY ago" +"%Y-%m-%dT%H:%M:%SZ"`\")"

Elenca e filtra gli avvisi in base all'etichetta utente. In questo esempio, filtra in base a un'etichetta utente con il nome app e il valore my-gke-app:

--data-urlencode "filter=(policy.user_labels.app=\"my-gke-app\")"
Gli utenti di PowerShell possono utilizzare il seguente esempio per aggiungere un filtro basato sul tempo all'URL della richiesta:
$baseUrl = "https://monitoring.googleapis.com/v3/projects/my-project/alerts"
$filterValue = (Get-Date).AddHours(-1).ToString("yyyy-MM-ddTHH:mm:ssZ")
$filter = 'open_time >= "' + $filterValue + '"'
$encodedFilter = [System.Uri]::EscapeDataString($filter)
$url = $baseUrl + "?filter=" + $encodedFilter

Indagare su un incidente

La pagina Dettagli incidente contiene informazioni che possono aiutarti a identificare la causa di un incidente.

Esplora i dati delle metriche

Per analizzare lo stato della metrica prima e dopo l'incidente, utilizza il grafico Metriche di avviso. Questo grafico mostra una cronologia e le serie temporali che hanno soddisfatto la condizione della tuacriterio di avvisoo.

Puoi regolare l'intervallo della sequenza temporale per cercare tendenze e pattern nei dati delle metriche relativi all'incidente:

  • Per alternare la visualizzazione delle sole serie temporali che hanno soddisfatto la condizione e la visualizzazione di tutte le serie temporali valutate dalla condizione, fai clic su Mostra tutte le serie temporali.

  • Per modificare l'intervallo di tempo visualizzato dal grafico, puoi utilizzare il selettore dell'intervallo di tempo nella barra degli strumenti o evidenziare gli intervalli di tempo sul grafico con il puntatore.

Puoi anche analizzare i dati delle metriche in modo più dettagliato visualizzandoli in Esplora metriche. Per farlo, vai al grafico Metriche di avviso e fai clic su Esplora dati. Per impostazione predefinita, Metrics Explorer aggrega e filtra i dati delle metriche in modo che il grafico delle metriche sia allineato alla serie temporale mostrata nella cronologia delle metriche di avviso.

Esplora le voci di log

Il riquadro Log nella pagina Dettagli incidente mostra le voci di log che corrispondono al tipo di risorsa e alle etichette della risorsa monitorata per la metrica. Puoi analizzare queste voci di log per trovare ulteriori informazioni che potrebbero aiutarti a risolvere il tuo incidente.

  • Per visualizzare le voci di log in Esplora log, fai clic su Visualizza in Esplora log, quindi seleziona un progetto di definizione dell'ambito. Esplora log fornisce strumenti aggiuntivi per analizzare i dati voce di log, come una cronologia della creazione delle voci di log correlate.
  • Per visualizzare e modificare la query utilizzata per filtrare le voci di log in Metrics Explorer, fai clic su Esplora dati.

Visualizzare le informazioni dell'applicazione

Per le policy di avviso associate a un'applicazione App Hub, vai alla sezione Associata all'applicazione. Una voce in questa sezione elenca l'ID applicazione e i link a una dashboard che mostra informazioni sull'applicazione. La seconda voce elenca un workload o un servizio e rimanda a una dashboard.

Visualizzare informazioni supplementari

La sezione Etichette mostra le etichette e i valori per la risorsa monitorata e la metrica della serie temporale che ha causato l'incidente, nonché le etichette utente definite nel criterio di avviso. Queste informazioni potrebbero aiutarti a identificare la risorsa monitorata specifica che ha causato l'incidente. Per saperne di più, consulta Annotare gli incidenti con le etichette.

La sezione Documentazione mostra il modello di documentazione per le notifiche che hai fornito durante la creazione della criterio di avviso. Queste informazioni potrebbero includere una descrizione di ciò che monitora la norma di avviso, nonché suggerimenti per la mitigazione. Per saperne di più, consulta Annotare le notifiche con la documentazione definita dall'utente.

Se non hai configurato la documentazione per la tua criterio di avviso, il riquadro Documentazione mostra il messaggio "Nessuna documentazione configurata".

Per aiutarti a scoprire i problemi sottostanti nella tua applicazione, puoi esplorare gli incidenti correlati ad altre condizionicriterio di avvisoo.

La sezione Incidenti correlati mostra un elenco di incidenti che corrispondono a uno dei seguenti elementi:

  • L'incidente è stato creato quando è stata soddisfatta una condizione dello stesso criterio di avviso.
  • L'incidente condivide un'etichetta con l'incidente mostrato nella pagina Dettagli incidente.

Gestire gli incidenti

Gli incidenti si trovano in uno dei seguenti stati:

  •  Aperto: Il set di condizioni del criterio di avviso è soddisfatto o non sono presenti dati che indicano che la condizione non è più soddisfatta. Se una criterio di avviso contiene più condizioni, gli incidenti vengono aperti a seconda di come vengono combinate queste condizioni. Per saperne di più, consulta Policy con più condizioni.

  •  Confermato: L'incidente è aperto ed è stato contrassegnato manualmente come confermato. In genere, questo stato indica che l'incidente è in fase di indagine.

  •  Chiuso: Il sistema ha rilevato che la condizione non è più soddisfatta, hai chiuso l'incidente o sono trascorsi 7 giorni senza che sia stato rilevato che la condizione continua a essere soddisfatta.

Quando configuri un criterio di avviso, assicurati che lo stato stazionario fornisca un segnale quando tutto va bene. Ciò è necessario per garantire che lo stato senza errori possa essere identificato e, se un incidente è aperto, per la chiusura dell'incidente. Se non è presente alcun segnale che indichi che una condizione di errore è terminata, dopo l'apertura di un incidente, questo rimane aperto per 7 giorni dopo l'attivazione del criterio di avviso.

Ad esempio, se crei un criterio di avviso che ti avvisa quando il conteggio degli errori è superiore a 0, assicurati che produca un conteggio di 0 errori quando non ce ne sono. Se la criterio di avviso restituisce null o vuoto nello stato senza errori, non è presente alcun segnale che indichi quando gli errori sono terminati. Se necessario, PromQL ti consente di specificare un valore predefinito che viene utilizzato quando non è disponibile alcun valore misurato.

Confermare gli incidenti

Ti consigliamo di contrassegnare un incidente come riconosciuto quando inizi a esaminare la causa dell'incidente.

Per contrassegnare un incidente come riconosciuto:

  1. Nella tabella Incidenti della pagina Avvisi, fai clic su Visualizza tutti gli incidenti.
  2. Nella pagina Incidenti, individua l'incidente che vuoi confermare e poi esegui una delle seguenti operazioni:

    • Fai clic su  Altre opzioni e seleziona Conferma.
    • Apri la pagina dei dettagli dell'incidente e fai clic su Conferma incidente.

Se la tua criterio di avviso è configurata per inviare notifiche ripetute, il riconoscimento di un incidente non interrompe le notifiche. Per interromperli, procedi in uno dei seguenti modi:

  • Crea una sospensione per il criterio di avviso.
  • Disattiva il criterio di avviso.

Posticipare un criterio di avviso

Per impedire a Monitoring di creare incidenti e inviare notifiche durante un periodo di tempo specifico, posticipa il criterio di avviso correlato. Quando posticipi un criterio di avviso, Monitoring chiude anche tutti gli incidenti correlati.

Per creare una sospensione per un incidente che stai visualizzando:

  1. Nella pagina Dettagli incidente, fai clic su Posticipa policy.

  2. Seleziona la durata del posticipo. Dopo aver selezionato la durata del posticipo, questo inizia immediatamente.

Puoi anche posticipare una criterio di avviso dalla pagina Incidenti individuando l'incidente che vuoi posticipare, facendo clic su  Altre opzioni e selezionando Posticipa. Puoi posticipare i criteri di avviso durante le interruzioni per evitare ulteriori notifiche durante la procedura di risoluzione dei problemi.

Chiudi incidenti

Puoi lasciare che Monitoring chiuda un incidente per te oppure puoi chiuderlo dopo che le osservazioni smettono di arrivare. Se chiudi un incidente e poi arrivano dati che indicano che la condizione è soddisfatta, viene creato un nuovo incidente. Quando chiudi un incidente, questa azione non chiude altri incidenti aperti per la stessa condizione. Se posticipi un criterio di avviso, gli incidenti aperti vengono chiusi all'inizio del posticipo.

Monitoring chiude automaticamente un incidente quando si verifica uno dei seguenti eventi:

  • Condizioni di soglia metrica:

    • Arriva un'osservazione che indica che la soglia non è stata superata.
    • Non arrivano osservazioni, la condizione è configurata per chiudere gli incident quando le osservazioni smettono di arrivare e lo stato della risorsa sottostante è sconosciuto o non è disattivato.

    • Non arrivano osservazioni per la durata di chiusura automatica della policy di avviso e la condizione non è configurata per chiudere automaticamente gli incident quando le osservazioni smettono di arrivare. Per configurare la durata di chiusura automatica, puoi utilizzare la console Google Cloud o l'API Monitoring. Per impostazione predefinita, la durata della chiusura automatica è di sette giorni. La durata minima di chiusura automatica è di 30 minuti.

  • Condizioni di assenza metrica:

    • Si verifica un'osservazione.
    • Non vengono ricevute osservazioni per 24 ore dopo la scadenza della durata di chiusura automatica del criterio di avviso. Per configurare la durata della chiusura automatica, puoi utilizzare la console Google Cloud o l'API Monitoring. Per impostazione predefinita, la durata della chiusura automatica è di sette giorni.
  • Condizioni di previsione:

    • Viene prodotta una previsione che indica che la serie temporale non supererà la soglia entro la finestra di previsione.
    • Non arrivano osservazioni per 10 minuti, la condizione è configurata per chiudere gli incidenti quando le osservazioni smettono di arrivare e lo stato della risorsa sottostante è sconosciuto o non è disattivato.

    • Non arrivano osservazioni per la durata di chiusura automatica della policy di avviso e la condizione non è configurata per chiudere automaticamente gli incident quando le osservazioni smettono di arrivare.

Ad esempio, un criterio di avviso ha generato un incidente perché la latenza della risposta HTTP è stata superiore a 2 secondi per 10 minuti consecutivi. Se la misurazione successiva della latenza della risposta HTTP è inferiore o uguale a due secondi, l'incidente viene chiuso. Allo stesso modo, se non vengono ricevuti dati per sette giorni, l'incidente viene chiuso.

Per chiudere un incidente:

  1. Nella tabella Incidenti della pagina Avvisi, fai clic su Visualizza tutti gli incidenti.
  2. Nella pagina Incidenti, individua l'incidente che vuoi chiudere, quindi esegui una delle seguenti operazioni:

    • Fai clic su  Visualizza altro e poi seleziona Chiudi incidente.
    • Apri la pagina Dettagli incidente per l'incidente e poi fai clic su Chiudi incidente.

Se visualizzi il messaggio Unable to close incident with active conditions, l'incidente non può essere chiuso perché sono stati ricevuti dati entro il periodo di avviso più recente.

Se visualizzi il messaggio Unable to close incident. Please try again in a few minutes., la richiesta non è stata chiusa a causa di un errore interno.

Conservazione e limiti dei dati

Per informazioni sui limiti e sul periodo di conservazione degli incidenti, consulta Limiti per gli avvisi.

Passaggi successivi