Questo argomento spiega come visualizzare le metriche di Apigee hybrid in una dashboard Cloud Operations.
Informazioni su Cloud Operations
Per saperne di più su metriche, dashboard e Cloud Operations, consulta:
Abilitazione delle metriche ibride
Prima che le metriche ibride possano essere inviate a Cloud Operations, devi prima abilitare la raccolta delle metriche. Per questa procedura, consulta la sezione Configurare la raccolta delle metriche.
Informazioni su nomi ed etichette delle metriche ibride
Se abilitato, ibrido compila automaticamente le metriche di Suite operativa di Google Cloud. Il prefisso del nome di dominio delle metriche create da ibrido è:
apigee.googleapis.com/
Ad esempio, la metrica /proxy/request_count contiene il numero totale di richieste ricevute da un proxy API. Il nome della metrica in Suite operativa di Google Cloud è quindi:
apigee.googleapis.com/proxy/request_count
Suite operativa di Google Cloud ti consente di filtrare e raggruppare i dati delle metriche in base alle etichette. Alcune etichette sono predefinite, mentre altre vengono aggiunte in modo esplicito da Hybrid. La sezione Metriche disponibili di seguito elenca tutte le metriche ibride disponibili e le etichette aggiunte specificamente per una metrica che puoi utilizzare per il filtraggio e il raggruppamento.
Visualizzazione delle metriche
L'esempio seguente mostra come visualizzare le metriche in Suite operativa di Google Cloud:- Apri Esplora metriche di Monitoring in un browser. In alternativa, se ti trovi già nella console Suite operativa di Google Cloud, seleziona Esplora metriche.
In Trova tipo di risorsa e metrica, individua e seleziona la metrica che vuoi esaminare. Scegli una metrica specifica elencata in Metriche disponibili o cerca una metrica.
- Seleziona la metrica che ti interessa.
- Applica i filtri. Le scelte di filtro per ogni metrica sono elencate in Metriche disponibili.
- Suite operativa di Google Cloud mostra il grafico per la metrica selezionata.
- Fai clic su Salva.
Creare una dashboard
Le dashboard sono un modo per visualizzare e analizzare i dati delle metriche importanti per te, Suite operativa di Google Cloud fornisce dashboard predefinite per le risorse e i servizi che utilizzi e puoi anche creare dashboard personalizzate.
Utilizzi un grafico per visualizzare una metrica Apigee nella dashboard personalizzata. Con le dashboard personalizzate, hai il controllo completo sui grafici visualizzati e sulla loro configurazione. Per saperne di più sulla creazione di grafici, vedi Creare grafici.
L'esempio seguente mostra come creare una dashboard in Suite operativa di Google Cloud e poi aggiungere grafici per visualizzare i dati delle metriche:
- Apri Esplora metriche di Monitoring in un browser e seleziona Dashboard.
- Seleziona + Crea dashboard.
- Assegna un nome alla dashboard. Ad esempio: Traffico di richieste proxy ibride
- Fai clic su Conferma.
Per ogni grafico che vuoi aggiungere alla dashboard:
- Nella dashboard, seleziona Aggiungi grafico.
- Seleziona la metrica che ti interessa come descritto in precedenza in Visualizzazione delle metriche.
- Completa la finestra di dialogo per definire il grafico.
- Fai clic su Salva. Suite operativa di Google Cloud mostra i dati per la metrica selezionata.
Metriche disponibili
Le tabelle seguenti elencano le metriche per l'analisi del traffico proxy. Per ulteriori informazioni su ciascuna metrica Apigee, consulta Metriche di Google Cloud.
Metriche sul traffico di proxy, destinazione e server
OpenTelemetry raccoglie ed elabora le metriche (come descritto in Raccolta delle metriche) per il traffico di proxy, target e server.
La seguente tabella descrive le metriche utilizzate dal collettore OpenTelemetry.
| Nome metrica | Utilizza |
|---|---|
/proxy/request_count |
Numero di richieste al proxy Apigee dall'ultimo campione registrato. |
/proxy/response_count |
Numero di risposte inviate dal proxy API Apigee. |
/proxy/latencies |
Distribuzione delle latenze, calcolate dal momento in cui la richiesta è stata ricevuta dal proxy Apigee al momento in cui la risposta è stata inviata dal proxy Apigee al client. |
/proxyv2/request_count |
Il numero totale di richieste proxy API ricevute. |
/proxyv2/response_count |
Il numero totale di risposte del proxy API ricevute. |
/proxyv2/latencies_percentile |
Percentile di tutte le risposte dei criteri API a una richiesta. |
/target/request_count |
Numero di richieste inviate alla destinazione Apigee dall'ultima registrazione del campione. |
/target/response_count |
Numero di risposte ricevute dal target Apigee dall'ultima registrazione del campione. |
/target/latencies |
Distribuzione delle latenze, calcolate dal momento in cui la richiesta è stata inviata al target Apigee al momento in cui la risposta è stata ricevuta dal proxy Apigee. Il tempo non include l'overhead del proxy API Apigee. |
/targetv2/request_count |
Il numero totale di richieste inviate alla destinazione del proxy. |
/targetv2/response_count |
Il numero totale di risposte ricevute dal target del proxy. |
/server/fault_count |
Il numero totale di errori per l'applicazione server. Ad esempio, l'applicazione potrebbe essere |
/server/nio |
Si tratta di una metrica di tipo indicatore che può essere filtrata in base all'etichetta state per recuperare i dettagli di varie etichette. I
valori rappresentano diverse operazioni di sistema e I/O. Le etichette come accepted, accepted_total, close_failed,
close_success, conn_pending, connected, connected_total, max_conn e timeouts sono correlate alle operazioni di socket e
connessione. Le etichette rimanenti si riferiscono ad altre operazioni di sistema. |
/server/num_threads |
Il numero di thread non daemon attivi nel server. |
/server/request_count |
Il numero totale di richieste ricevute dall'applicazione server. Ad esempio, l'applicazione potrebbe essere |
/server/response_count |
Numero totale di risposte inviate dall'applicazione server. Ad esempio, l'applicazione potrebbe essere |
/server/latencies |
Latenza in millisecondi introdotta dall'applicazione server. Ad esempio, l'applicazione potrebbe essere |
/upstream/request_count |
Il numero di richieste inviate dall'applicazione server alla sua applicazione upstream. Ad esempio, per |
/upstream/response_count |
Il numero di risposte ricevute dall'applicazione server dalla sua applicazione upstream. Ad esempio, per |
/upstream/latencies |
La latenza sostenuta nell'applicazione server upstream in millisecondi. Ad esempio, per |
Metriche Cassandra
OpenTelemetry raccoglie ed elabora le metriche (come descritto in Raccolta delle metriche) per Cassandra proprio come fa per altri servizi ibridi.
La seguente tabella descrive le metriche utilizzate dal raccoglitore OpenTelemetry nei dati delle metriche Cassandra.
| Nome metrica (escluso il dominio) | Utilizza |
|---|---|
/cassandra/process_max_fds |
Numero massimo di descrittori di file aperti. |
/cassandra/process_open_fds |
Descrittori di file aperti. |
/cassandra/jvm_memory_pool_bytes_max |
Utilizzo massimo della memoria JVM per il pool. |
/cassandra/jvm_memory_pool_bytes_init |
Utilizzo iniziale della memoria JVM per il pool. |
/cassandra/jvm_memory_bytes_max |
Utilizzo massimo della memoria heap della JVM. |
/cassandra/process_cpu_seconds_total |
Tempo CPU utente e sistema trascorso in secondi. |
/cassandra/jvm_memory_bytes_used |
Utilizzo della memoria heap della JVM. |
/cassandra/compaction_pendingtasks |
Compattazioni in attesa per le sstable di Cassandra. Per saperne di più, consulta Compattazione. |
/cassandra/jvm_memory_bytes_init |
Utilizzo iniziale della memoria heap della JVM. |
/cassandra/jvm_memory_pool_bytes_used |
Utilizzo della memoria del pool JVM. |
/cassandra/jvm_memory_pool_bytes_committed |
Utilizzo della memoria di commit del pool JVM. |
/cassandra/clientrequest_latency |
Latenza delle richieste di lettura nell'intervallo del 75° percentile in microsecondi. |
/cassandra/jvm_memory_bytes_committed |
Utilizzo della memoria di heap JVM di cui è stato eseguito il commit. |
Utilizzo delle metriche Cassandra
Apigee consiglia di monitorare le seguenti metriche, in quanto sono fondamentali per il tuo database Cassandra:
- Tasso di richieste Cassandra: utilizza questa metrica per monitorare il tasso di richieste di lettura e scrittura di Cassandra.
Metrica: apigee.googleapis.com/cassandra/clientrequest_latencyEtichette risorse: project_id,location,cluster_name,namespace_name,pod_name,container_nameEtichette metriche: scope,unitUtilizza queste etichette per filtrare la risorsa specifica o per il raggruppamento.
Per monitorare tasso di richieste di lettura di Cassandra, applica il seguente filtro.
Filtri: metric.scope == 'Read'
metric.unit == 'OneMinuteRate'Per monitorare tasso di richieste di scrittura di Cassandra, applica il seguente filtro.
Filtri: metric.scope == 'Write'
metric.unit == 'OneMinuteRate' - Latenza delle richieste Cassandra: utilizza questa metrica per monitorare la latenza delle richieste di lettura e scrittura di Cassandra. Si tratta della stessa metrica della tasso di richieste,
apigee.googleapis.com/cassandra/clientrequest_latencycon filtri diversi applicati.Per monitorare la latenza delle richieste di lettura di Cassandra, applica il seguente filtro.
Filtri: metric.scope == 'Read'
metric.unit == '99thPercentile'o'95thPercentile'o'75thPercentile'Per monitorare la latenza delle richieste di scrittura di Cassandra, applica il seguente filtro.
Filtri: metric.scope == 'Write'
metric.unit == '99thPercentile'o'95thPercentile'o'75thPercentile' - Utilizzo della richiesta di CPU del pod Cassandra
Metrica: kubernetes.io/container/cpu/request_utilization (GKE on Google Cloud)
Per ulteriori informazioni, consulta Metriche Kubernetes.
kubernetes.io/anthos/container/cpu/request_utilization (Google Distributed Cloud)Etichette risorse: project_id,location,cluster_name,namespace_name,pod_name,container_nameUtilizza queste etichette per filtrare la risorsa specifica o per il raggruppamento.
- Utilizzo del volume di dati Cassandra
Metrica: kubernetes.io/pod/volume/utilization (GKE on Google Cloud)
Per ulteriori informazioni, consulta Metriche Kubernetes.
kubernetes.io/anthos/pod/volume/utilization (Google Distributed Cloud)Etichette risorse: project_id,location,cluster_name,namespace_name,pod_nameEtichette metriche: volume_nameUtilizza queste etichette per filtrare la risorsa specifica o per il raggruppamento.
Consigli per scalare il cluster Cassandra
Le seguenti linee guida possono fungere da cluster consigliato per la decisione di scalare il cluster Cassandra. In generale, se le richieste di lettura o scrittura mostrano costantemente una latenza del 99° percentile o la latenza è in continuo aumento e si notano picchi corrispondenti nell'utilizzo della CPU e nelle percentuali di richieste di lettura o scrittura, il cluster Cassandra può essere considerato sotto stress. Ti consigliamo di aumentare le dimensioni del cluster. Per ulteriori informazioni, vedi Scalabilità di Cassandra
| Metrica | Soglia | Durata del trigger |
|---|---|---|
kubernetes.io/pod/volume/utilization | 85% | 5min |
kubernetes.io/container/cpu/request_utilization | 85% | 3min |
Read request Latency 99thPercentile | 5s | 3min |
Write request Latency 99thPercentile | 5s | 3min |