Metriche di monitoraggio supportate

Questa pagina elenca le metriche disponibili per Memorystore for Redis Cluster e descrive cosa misura ciascuna metrica.

Metriche di backup

Questa sezione elenca e descrive le metriche di backup e importazione.

Metriche a livello di cluster

Questa sezione elenca e descrive le metriche di backup e importazione a livello di cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/backup/last_backup_start_time Questa metrica mostra l'ora di inizio dell'ultima operazione di backup.
redis.googleapis.com/cluster/backup/last_backup_status Questa metrica mostra se l'ultimo tentativo di backup è stato completato correttamente o non è riuscito. Gli stati sono 1 per Success e 0 per Failed.
redis.googleapis.com/cluster/backup/last_backup_duration Questa metrica mostra la durata dell'ultima operazione di backup (in millisecondi).
redis.googleapis.com/cluster/backup/last_backup_size Questa metrica mostra le dimensioni dell'ultimo backup (in byte). Questa metrica è un indicatore chiave per monitorare l'efficienza del backup e la pianificazione della capacità di archiviazione.
redis.googleapis.com/cluster/import/last_import_start_time Questa metrica mostra l'ora di inizio dell'ultima operazione di importazione.
redis.googleapis.com/cluster/import/last_import_duration Questa metrica mostra la durata dell'ultima operazione di importazione (in millisecondi).

Metriche dell'autorità di certificazione (CA)

Questa sezione elenca le metriche associate alle autorità di certificazione (CA) gestite dal cliente.

Metriche a livello di cluster

Queste metriche forniscono una panoramica generale dei certificati associati alle macchine di un cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/security/rotate_tls_cert_count

Questa metrica mostra lo stato dei certificati rotanti associati alle macchine in un cluster.

La metrica può avere i seguenti stati:

  • SUCCESS: Memorystore for Redis Cluster ha eseguito la rotazione del certificato.
  • FAILED: Memorystore for Redis Cluster non ha eseguito la rotazione del certificato perché non è disponibile, Memorystore for Redis Cluster non dispone delle autorizzazioni per eseguire la rotazione del certificato o si è verificato un errore interno.
  • SKIPPED: Memorystore for Redis Cluster ha saltato la rotazione del certificato perché non deve essere ruotato.

Metriche di Cloud Monitoring

Questa sezione elenca e descrive le metriche di Cloud Monitoring disponibili per Memorystore for Redis Cluster.

Metriche a livello di cluster

Queste metriche forniscono una panoramica generale dell'integrità e delle prestazioni complessive di un cluster. Puoi utilizzare le metriche per comprendere la capacità e l'utilizzo complessivi di un cluster, nonché per identificare potenziali colli di bottiglia o aree di miglioramento.

Nome metrica Descrizione
redis.googleapis.com/cluster/clients/average_connected_clients Questa metrica misura il numero medio di connessioni client attive a un cluster in un periodo di tempo specificato. Puoi utilizzare la metrica per monitorare lo scaling delle connessioni, identificare i colli di bottiglia delle applicazioni e assicurarti che il cluster sia stabile.
redis.googleapis.com/cluster/clients/maximum_connected_clients Questa metrica mostra il numero massimo di connessioni client attive in tutti i nodi di un cluster. Puoi utilizzare la metrica per monitorare il carico di connessione più elevato sul cluster in qualsiasi momento. Ciò è fondamentale per garantire un rendimento elevato per il cluster, perché un numero elevato di connessioni può aumentare i tempi di risposta.
redis.googleapis.com/cluster/clients/total_connected_clients Questa metrica monitora il numero attuale di connessioni client attive a un cluster. Puoi utilizzare la metrica per monitorare il carico del database e prevenire i limiti di connessione.
redis.googleapis.com/cluster/stats/total_connections_received_count Questa metrica mostra il numero cumulativo di connessioni client create in un cluster nell'ultimo minuto. Puoi utilizzare la metrica per analizzare il carico di traffico, assicurarti che i limiti di connessione non vengano superati e determinare se è necessario scalare il cluster.
redis.googleapis.com/cluster/stats/total_rejected_connections_count Questa metrica monitora il numero totale di connessioni a un cluster che vengono rifiutate perché è stato raggiunto il limite di maxclients.
redis.googleapis.com/cluster/commandstats/total_usec_count Questa metrica misura il tempo totale della CPU consumato da ogni comando. La metrica indica i microsecondi totali utilizzati, fornendo informazioni dettagliate su rendimento e latenza di un cluster.
redis.googleapis.com/cluster/commandstats/total_calls_count Questa metrica misura il numero totale di chiamate associate a un comando specifico su un nodo del cluster in un minuto. Per identificare i colli di bottiglia o il traffico elevato su comandi specifici, puoi utilizzare la metrica per monitorare il throughput dei comandi (comandi al minuto) nei nodi primari e di replica.
redis.googleapis.com/cluster/cpu/average_utilization Questa metrica mostra l'utilizzo medio della CPU per un cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per identificare le risorse con provisioning eccessivo o sottoutilizzate, gestire le soglie di scalabilità automatica e rilevare i colli di bottiglia delle prestazioni, con un utilizzo ideale del 40-70%.
redis.googleapis.com/cluster/cpu/maximum_utilization

Questa metrica mostra l'utilizzo di picco della CPU in tutti i nodi di un cluster (da 0,0 a 1,0).

La metrica riepiloga solo gli stati sys_main_thread e user_main_thread. Non include altri stati della CPU (come sys_children o user_children) disponibili nella metrica /cluster/node/cpu/utilization .

Assicurati che l'utilizzo della CPU non superi 0,8 secondi per il nodo principale e 0,5 secondi per ogni replica designata come replica di lettura. Per saperne di più, consulta le best practice per l'utilizzo della CPU.

redis.googleapis.com/cluster/stats/average_expired_keys Questa metrica misura il numero medio di eventi di scadenza delle chiavi per tutti i nodi principali di un cluster. Puoi utilizzare la metrica per monitorare il numero di chiavi in scadenza.
redis.googleapis.com/cluster/stats/maximum_expired_keys Questa metrica misura il numero massimo di eventi di scadenza delle chiavi che si verificano in tutti i nodi principali di un cluster.
redis.googleapis.com/cluster/stats/total_expired_keys_count Questa metrica monitora il numero totale di eventi di scadenza delle chiavi che si verificano in tutti i nodi principali di un cluster. Puoi utilizzare la metrica per monitorare il numero di chiavi in scadenza.
redis.googleapis.com/cluster/stats/average_evicted_keys Questa metrica monitora il numero medio di chiavi eliminate a causa di vincoli di capacità di memoria negli shard principali di un cluster.
redis.googleapis.com/cluster/stats/maximum_evicted_keys Questa metrica mostra il numero più elevato di chiavi eliminate da un nodo o shard di un cluster primario a causa della capacità di memoria.
redis.googleapis.com/cluster/stats/total_evicted_keys_count Questa metrica mostra il numero totale di chiavi eliminate da un nodo di un cluster primario a causa della capacità di memoria.
redis.googleapis.com/cluster/keyspace/total_keys Questa metrica mostra il numero di chiavi archiviate in un cluster.
redis.googleapis.com/cluster/stats/average_keyspace_hits Questa metrica mostra il numero medio di ricerche riuscite di chiavi in tutti i nodi di un cluster.
redis.googleapis.com/cluster/stats/maximum_keyspace_hits Questa metrica mostra il numero massimo di ricerche riuscite di chiavi in un nodo del cluster. Puoi utilizzare la metrica per monitorare le prestazioni del cluster e identificare potenziali hotspot nel cluster.
redis.googleapis.com/cluster/stats/total_keyspace_hits_count Questa metrica monitora il numero cumulativo di ricerche riuscite di chiavi in tutti i nodi di un cluster.
redis.googleapis.com/cluster/stats/average_keyspace_misses Questa metrica mostra il numero medio di ricerche non riuscite di chiavi in un cluster. Puoi utilizzare la metrica per monitorare la frequenza con cui vengono richieste le chiavi, ma non vengono trovate nella cache.
redis.googleapis.com/cluster/stats/maximum_keyspace_misses Questa metrica mostra il numero massimo di ricerche non riuscite di chiavi in un nodo del cluster.
redis.googleapis.com/cluster/stats/total_keyspace_misses_count Questa metrica mostra il numero totale di ricerche non riuscite di chiavi in tutti i nodi del cluster.
redis.googleapis.com/cluster/memory/average_utilization Questa metrica mostra l'utilizzo medio della memoria in un cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per monitorare la capacità del cluster e per impostare le soglie di avviso. Ad esempio, puoi impostare una soglia di avviso per notificare agli utenti quando la memoria media supera una percentuale specifica (ad esempio, l'80%).
redis.googleapis.com/cluster/memory/maximum_utilization Questa metrica mostra l'utilizzo massimo della memoria in tutti i nodi del cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per identificare quando scalare un cluster. Ti consigliamo di monitorare l'utilizzo per assicurarti che rimanga al di sotto del 100%. In caso di carichi di scrittura elevati, le prestazioni potrebbero peggiorare se questa metrica raggiunge il 65-85%.
redis.googleapis.com/cluster/memory/total_used_memory Questa metrica mostra l'utilizzo totale della memoria di un cluster (in byte). Puoi utilizzare la metrica per monitorare la capacità del cluster.
redis.googleapis.com/cluster/memory/size Questa metrica misura la RAM totale, utilizzata e disponibile in tutti i nodi di un cluster. Puoi utilizzare la metrica per monitorare la capacità del cluster e per prevenire errori dei nodi.
redis.googleapis.com/cluster/replication/average_ack_lag Questa metrica mostra il ritardo medio di riconoscimento (in secondi) delle repliche in un cluster. Il

ritardo di riconoscimento è un collo di bottiglia sul nodo primario di un cluster. Questo collo di bottiglia è causato dalle repliche che non riescono a tenere il passo con le informazioni che il nodo primario invia. In questo caso, il nodo primario deve attendere la conferma che le repliche hanno ricevuto le informazioni. Ciò potrebbe rallentare i commit delle transazioni e causare un impatto sulle prestazioni del nodo primario.
redis.googleapis.com/cluster/replication/maximum_ack_lag Questa metrica mostra il ritardo di riconoscimento massimo (in secondi) delle repliche in un cluster.
redis.googleapis.com/cluster/replication/average_offset_diff Questa metrica mostra la differenza media dell'offset di riconoscimento della replica (in byte) in un cluster.

La differenza di offset di riconoscimento della replica indica il numero di byte che non vengono replicati tra le repliche e i relativi cluster principali.
redis.googleapis.com/cluster/replication/maximum_offset_diff Questa metrica mostra la differenza massima di offset di replica (in byte) in un cluster.

La differenza di offset di replica indica il numero di byte non replicati tra le repliche e i relativi cluster principali.
redis.googleapis.com/cluster/stats/total_net_input_bytes_count Questa metrica mostra il conteggio dei byte di rete in entrata ricevuti dagli endpoint di un cluster.
redis.googleapis.com/cluster/stats/total_net_output_bytes_count Questa metrica mostra il conteggio dei byte di rete in uscita inviati dagli endpoint di un cluster.

Metriche a livello di nodo

Queste metriche offrono approfondimenti dettagliati sull'integrità e sul rendimento dei singoli nodi all'interno di un cluster. Puoi utilizzare le metriche per risolvere i problemi relativi ai nodi e ottimizzarne il rendimento.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/clients/connected_clients Questa metrica indica il numero di connessioni client attive a un nodo del cluster, escluse le connessioni di replica. Puoi utilizzare la metrica per monitorare i limiti di connessione e identificare gli hotspot in cui uno shard riceve un traffico sproporzionato.
redis.googleapis.com/cluster/node/clients/blocked_clients Questa metrica mostra il numero di connessioni client bloccate da un nodo del cluster. Un numero elevato o in rapido aumento di connessioni client bloccate potrebbe indicare che molti client sono in attesa di operazioni. Ciò può comportare un aumento della latenza.
redis.googleapis.com/cluster/node/server/uptime Questa metrica misura l'uptime di un nodo del cluster. Puoi utilizzare la metrica per monitorare per quanto tempo un server viene eseguito ininterrottamente senza riavvii o errori.
redis.googleapis.com/cluster/node/stats/connections_received_count Questa metrica monitora il numero totale di connessioni client create su un nodo del cluster in un periodo di tempo specificato. Puoi utilizzare la metrica per monitorare il traffico di connessione ai singoli nodi all'interno di un cluster. Di conseguenza, puoi analizzare la distribuzione del carico e identificare i picchi di attività di connessione.
redis.googleapis.com/cluster/node/stats/rejected_connections_count Questa metrica mostra il numero di connessioni rifiutate perché un nodo del cluster raggiunge il limite di maxclients. Puoi utilizzare la metrica per identificare se un nodo è sotto pressione per un numero elevato di connessioni e rifiuta nuove connessioni perché non può gestirne altre.
redis.googleapis.com/cluster/node/commandstats/usec_count Questa metrica mostra il tempo totale impiegato da ogni comando in un nodo del cluster. Puoi utilizzare la metrica per analizzare le prestazioni dei comandi, identificare i comandi lenti e risolvere i problemi di latenza a livello di nodo.
redis.googleapis.com/cluster/node/commandstats/calls_count Questa metrica monitora il numero totale di chiamate per un comando su un nodo del cluster al minuto. Puoi utilizzare la metrica per monitorare la distribuzione del traffico, identificare i comandi più utilizzati e risolvere i colli di bottiglia sui singoli nodi.
redis.googleapis.com/cluster/node/cpu/utilization Questa metrica mostra l'utilizzo della CPU per un nodo del cluster (da 0,0 a 1,0).
redis.googleapis.com/cluster/node/stats/expired_keys_count Questa metrica mostra il numero totale di eventi di scadenza in un nodo del cluster. Puoi utilizzare la metrica per monitorare la velocità con cui le chiavi vengono rimosse dal cluster perché la relativa durata (TTL) raggiunge lo zero.
redis.googleapis.com/cluster/node/stats/evicted_keys_count Questa metrica conteggia il numero totale di chiavi che un nodo del cluster espelle perché il cluster raggiunge il limite massimo di memoria. La metrica può identificare se un cluster è sotto pressione della memoria. Un numero elevato o in aumento di chiavi rimosse indica che un cluster sta esaurendo lo spazio. Di conseguenza, il cluster rimuove le chiavi per fare spazio a nuovi dati.
redis.googleapis.com/cluster/node/keyspace/total_keys Questa metrica misura il numero totale di chiavi archiviate da un nodo del cluster. La metrica fornisce visibilità sulla distribuzione e sullo sharding dei dati tra i nodi.
redis.googleapis.com/cluster/node/stats/keyspace_hits_count Questa metrica monitora il numero di ricerche di chiavi riuscite su un nodo del cluster. Puoi utilizzare la metrica per monitorare l'efficienza con cui il nodo deve recuperare i dati in memoria.
redis.googleapis.com/cluster/node/stats/keyspace_misses_count Questa metrica monitora il numero di ricerche di chiavi non riuscite su un nodo del cluster.
redis.googleapis.com/cluster/node/memory/utilization Questa metrica monitora l'utilizzo della memoria in un nodo del cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per prevenire i guasti dei nodi e garantire la stabilità di un cluster.
redis.googleapis.com/cluster/node/memory/usage Questa metrica misura la memoria utilizzata totale di un nodo del cluster.
redis.googleapis.com/cluster/node/stats/net_input_bytes_count Questa metrica misura il numero totale di byte di rete in entrata che un nodo del cluster riceve. Puoi utilizzare la metrica per monitorare il throughput di rete, identificare potenziali colli di bottiglia e analizzare i picchi di traffico sul nodo.
redis.googleapis.com/cluster/node/stats/net_output_bytes_count Questa metrica misura il numero totale di byte di rete in uscita inviati da un nodo cluster. Puoi utilizzare la metrica per monitorare il volume di traffico in uscita di rete per il nodo a fini di ottimizzazione delle prestazioni e pianificazione della capacità.
redis.googleapis.com/cluster/node/replication/offset Questa metrica misura i byte di offset di replica di un nodo del cluster. Prima di promuovere le repliche di un cluster a cluster primari, puoi utilizzare la metrica per verificare se le repliche hanno elaborato tutti i dati. In questo modo si evita la perdita di dati.
redis.googleapis.com/cluster/node/server/healthy Questa metrica determina se un nodo del cluster è disponibile e funziona correttamente.

Metriche di replica tra regioni

Questa sezione elenca e descrive le metriche di replica tra regioni.

Nome metrica Descrizione
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links Questa metrica mostra il numero di link di shard tra i cluster primario e secondario. All'interno di un gruppo di replica tra regioni, un cluster principale segnala il numero di link di replica CRR che ha con i cluster secondari del gruppo. Per ogni cluster secondario, questo numero dovrebbe essere uguale al numero di shard. Se, inaspettatamente, il numero scende al di sotto del numero di shard, questo identifica il numero di shard in cui la replica tra il replicatore e il follower è cessata. In uno stato ideale, questa metrica dovrebbe avere lo stesso numero del conteggio degli shard del cluster primario.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff Questa metrica misura la differenza massima di offset di replica (in byte) tra gli shard primari e secondari (replica) di un cluster in diverse regioni.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff Questa metrica misura la differenza media di offset di replica (in byte) tra gli shard primari e di replica di un cluster in diverse regioni. Valori elevati per la metrica indicano un ritardo di replica, che puoi risolvere mettendo in pausa e riprendendo la replica.

Metriche JSON

Questa sezione elenca le metriche a livello di nodo per i documenti JSON.

Metriche a livello di nodo

Queste metriche offrono informazioni dettagliate sul numero totale di documenti JSON e sulla quantità di memoria che consumano.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/json/documents_count Questa metrica misura il numero totale di documenti JSON che si trovano su un nodo del cluster. Puoi utilizzare la metrica per monitorare la distribuzione e la capacità dei dati, perché mostra il numero di documenti indicizzati, eliminati o uniti a livello di nodo.
redis.googleapis.com/cluster/node/json/used_memory Questa metrica misura la quantità di memoria (in byte o come percentuale della memoria disponibile) utilizzata dai documenti JSON. Puoi utilizzare la metrica per monitorare la capacità, identificare i nodi con limiti di memoria e attivare azioni di scalabilità.

Metriche di persistenza

Questa sezione elenca e descrive le metriche di persistenza.

Metriche di persistenza RDB

Questa sezione elenca e descrive le metriche di persistenza di Redis Database (RDB).

Metriche a livello di cluster

Questa sezione elenca e descrive le metriche di persistenza RDB a livello di cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/persistence/rdb_saves_count

Questa metrica monitora il numero cumulativo di volte in cui viene acquisita un'istantanea di persistenza RDB (nota anche come salvataggio RDB) su un nodo del cluster. Puoi utilizzare la metrica per monitorare la frequenza e il successo degli snapshot RDB in base al nodo.

La metrica ha un campo status_code. Per verificare se uno snapshot RDB non va a buon fine, filtra il campo status_code in base allo stato 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/persistence/rdb_save_ages Questa metrica mostra l'età di un'istantanea della distribuzione per tutti i nodi di un cluster. In caso di incidente di ripristino, puoi utilizzare la metrica per visualizzare il periodo di tempo per l'obsolescenza dei dati. Idealmente, la distribuzione ha valori con un tempo di ritardo inferiore (o uguale) alla frequenza dello snapshot.

Metriche a livello di nodo

Nome metrica Descrizione
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress Questa metrica indica se un salvataggio in background RDB (BGSAVE) è attivo su un nodo del cluster. Uno stato TRUE indica che BGSAVE è attivo.
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status Questa metrica indica se l'operazione BGSAVE su un nodo del cluster è stata completata o se si è verificato un errore. Lo stato TRUE indica che l'operazione è stata completata.
redis.googleapis.com/cluster/node/persistence/rdb_saves_count Questa metrica monitora il numero cumulativo di snapshot RDB creati su un nodo del cluster. Puoi utilizzare la metrica per monitorare la frequenza e la riuscita degli snapshot sul nodo.
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age Questa metrica misura il tempo, in secondi, trascorso dall'ultimo snapshot RDB riuscito. Puoi utilizzare la metrica per monitorare l'obsolescenza dei dati di persistenza RDB su un nodo del cluster.
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until Questa metrica misura il tempo rimanente, in secondi, fino al prossimo snapshot RDB pianificato su un nodo del cluster. Puoi utilizzare la metrica per monitorare la pianificazione della persistenza RDB e tenere traccia di quando viene eseguito lo snapshot automatico successivo.
redis.googleapis.com/cluster/node/persistence/current_save_keys_total Questa metrica monitora il numero totale di chiavi elaborate nell'operazione di salvataggio RDB corrente su un nodo del cluster.

Metriche di persistenza AOF

Questa sezione elenca e descrive le metriche di persistenza dei file di tipo Append-Only File (AOF).

Metriche a livello di cluster

Questa sezione elenca e descrive le metriche di persistenza AOF a livello di cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/persistence/aof_fsync_lags

Questa metrica misura la differenza di tempo (o ritardo) per tutti i nodi di un cluster che passa tra la scrittura dei dati nel file AOF e il momento in cui i dati vengono sincronizzati correttamente con l'archiviazione durevole.

Quando il parametro appendfsync è impostato su everysec, puoi utilizzare la metrica per valutare l'integrità della persistenza per il cluster. Idealmente, la distribuzione del ritardo deve avere valori con un tempo di ritardo inferiore (o uguale) alla frequenza di sincronizzazione dell'AOF.

redis.googleapis.com/cluster/persistence/aof_rewrite_count

Questa metrica monitora il numero cumulativo di volte in cui un nodo del cluster attiva un'operazione di riscrittura AOF. Puoi utilizzare la metrica per diagnosticare problemi di rendimento, perché un'alta frequenza di riscritture AOF potrebbe causare picchi di latenza o pressione della memoria sul cluster.

La metrica ha un campo status_code. Per verificare se le riscritture AOF non vanno a buon fine, filtra questo campo in base allo stato 3 - INTERNAL_ERROR.

Metriche a livello di nodo

Questa sezione elenca e descrive le metriche di persistenza AOF a livello di nodo.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/persistence/aof_last_write_status Questa metrica mostra lo stato dell'ultima operazione di scrittura nel file AOF su un nodo del cluster. Se lo stato è TRUE, l'operazione di scrittura è riuscita. Puoi utilizzare la metrica per verificare che Memorystore for Redis Cluster mantenga i dati correttamente.
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status Questa metrica mostra lo stato dell'ultima operazione AOF bgrewrite su un nodo del cluster. Se lo stato è TRUE, l'operazione è riuscita.
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

Questa metrica misura la differenza di tempo (o ritardo) per un nodo del cluster che passa tra la scrittura dei dati nel file AOF e il momento in cui i dati vengono sincronizzati correttamente con l'archiviazione durevole.

Quando il parametro appendfsync è impostato su everysec, puoi utilizzare la metrica per valutare l'integrità della persistenza per il nodo. Se il processo di sincronizzazione dei dati richiede più di 1 secondo, la persistenza è in ritardo rispetto ai dati in entrata, il che può comportare un calo delle prestazioni o la perdita di dati in caso di arresto anomalo.

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

Questa metrica monitora il numero cumulativo di volte in cui un nodo del cluster attiva un'operazione di riscrittura AOF. Puoi utilizzare la metrica per diagnosticare i problemi di prestazioni. Frequenze elevate di riscrittura AOF possono comportare un aumento della latenza o della pressione della memoria sul cluster.

La metrica ha un campo status_code. Per verificare se le riscritture AOF non vanno a buon fine, filtra questo campo in base allo stato 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count Questa metrica tiene traccia del numero cumulativo di volte in cui la chiamata di sistema AOF fsync() non riesce su un nodo del cluster. La metrica è applicabile solo ai cluster abilitati per AOF in cui il parametro appendfsync è impostato su everysec o always.

Metriche di persistenza comuni

Questa sezione elenca e descrive le metriche applicabili sia alla persistenza AOF sia a quella RDB.

Metriche a livello di nodo

Questa sezione elenca e descrive le metriche di persistenza AOF e RDB a livello di nodo.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/persistence/auto_restore_count

Questa metrica tiene traccia del numero cumulativo di volte in cui un nodo del cluster viene ripristinato automaticamente da un file di dump della persistenza (AOF o RDB).

La metrica ha un campo status_code. Per verificare se i ripristini non vanno a buon fine, filtra questo campo in base allo stato 3 - INTERNAL_ERROR.

Esempi di casi d'uso per le metriche di permanenza

Controlla se le operazioni di scrittura AOF causano latenza e pressione della memoria

Supponiamo che tu rilevi un aumento della latenza o della memoria utilizzata nel cluster o nel nodo all'interno del cluster. In questo caso, ti consigliamo di verificare se l'utilizzo aggiuntivo è correlato alla persistenza AOF.

Poiché sai che le operazioni di riscrittura AOF possono attivare picchi di carico temporanei, puoi ispezionare la metrica aof_rewrites_count che fornisce il conteggio cumulativo delle riscritture AOF durante il ciclo di vita del cluster o del nodo all'interno del cluster. Supponiamo che questa metrica mostri che gli incrementi del conteggio delle riscritture corrispondono a un aumento della latenza. In questa circostanza, puoi risolvere il problema riducendo la velocità di scrittura o aumentando il conteggio degli shard per ridurre la frequenza di riscrittura.

Controlla se le operazioni di salvataggio RDB causano latenza e pressione della memoria

Supponiamo che tu rilevi un aumento della latenza o della memoria utilizzata nel cluster o nel nodo all'interno del cluster. In questo caso, ti consigliiamo di verificare se l'utilizzo aggiuntivo è correlato alla persistenza RDB.

Poiché sai che le operazioni di salvataggio RDB possono attivare picchi di carico temporanei, puoi controllare la metrica rdb_saves_count, che fornisce il conteggio cumulativo dei salvataggi RDB durante il ciclo di vita del cluster o del nodo all'interno del cluster. Supponiamo che questa metrica mostri che gli incrementi del conteggio dei salvataggi RDB corrispondono a un aumento della latenza. In questo caso, potresti ridurre l'intervallo di snapshot RDB per diminuire la frequenza di riscrittura. Puoi anche fare lo scale out del cluster per ridurre i livelli di carico di base.

Interpretare le metriche per Memorystore for Redis Cluster

Come mostrato nell'elenco precedente, molte metriche condividono tre categorie: media, massimo e totale.

Per Memorystore for Redis Cluster, forniamo variazioni media e massima della stessa metrica, in modo da poterle utilizzare entrambe per identificare gli hotspot per quella famiglia di metriche.

Il valore totale della metrica è indipendente e fornisce approfondimenti separati non correlati allo scopo delle variazioni media e massima per gli hotspot.

Informazioni sulle metriche media e massima

Supponiamo di confrontare i valori average_keyspace_hits e maximum_keyspace_hits per il cluster. Man mano che la differenza tra le due metriche aumenta, una differenza maggiore indica che ci sono più hotspot per gli hit nel tuo cluster. Un valore vicino a average_keyspace_hits e maximum_keyspace_hits indica che gli hit sono distribuiti in modo più uniforme nel cluster.

Questo principio si applica a tutte le metriche che presentano le varianti media e massima della stessa metrica.

Esempio di hotspot

Se confronti average_keyspace_hits e maximum_keyspace_hits per tutti gli shard del cluster, il confronto di questi valori indica dove si verificano gli hotspot. Ad esempio, supponiamo che gli shard in un cluster di 6 shard abbiano il seguente numero di hit:

  • Shard 1 - 2 hit
  • Shard 2 – 2 colpi
  • Shard 3 – 2 colpi
  • Shard 4 – 2 hit
  • Shard 5 – 2 colpi
  • Shard 6-8 hit

In questo esempio, average_keyspace_hits restituisce un valore pari a 3 e maximum_keyspace_hits restituisce 8, il che indica che lo shard 6 è caldo.

Forniamo metriche a livello di nodo che puoi utilizzare per identificare gli hotspot nel cluster.