Metriche di monitoraggio supportate

Questa pagina elenca le metriche disponibili per Memorystore for Redis Cluster e descrive cosa misura ciascuna metrica.

Per scoprire come visualizzare queste metriche, consulta Monitorare i cluster.

Metriche di backup

Questa sezione elenca e descrive le metriche di backup e importazione.

Metriche a livello di cluster

Questa sezione elenca e descrive le metriche di backup e importazione a livello di cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/backup/last_backup_start_time Questa metrica mostra l'ora di inizio dell'ultima operazione di backup.
redis.googleapis.com/cluster/backup/last_backup_status Questa metrica mostra se l'ultimo tentativo di backup è stato completato correttamente o non è andato a buon fine. Gli stati sono 1 per Success e 0 per Failed.
redis.googleapis.com/cluster/backup/last_backup_duration Questa metrica mostra la durata dell'ultima operazione di backup (in millisecondi).
redis.googleapis.com/cluster/backup/last_backup_size Questa metrica mostra le dimensioni dell'ultimo backup (in byte). Questa metrica è un indicatore chiave per monitorare l'efficienza del backup e la pianificazione della capacità di archiviazione.
redis.googleapis.com/cluster/import/last_import_start_time Questa metrica mostra l'ora di inizio dell'ultima operazione di importazione.
redis.googleapis.com/cluster/import/last_import_duration Questa metrica mostra la durata dell'ultima operazione di importazione (in millisecondi).

Metriche dell'autorità di certificazione (CA)

Questa sezione elenca le metriche associate alle autorità di certificazione (CA) gestite dal cliente.

Metriche a livello di cluster

Queste metriche forniscono una panoramica generale dei certificati associati alle macchine di un cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/security/rotate_tls_cert_count

Questa metrica mostra lo stato dei certificati di rotazione associati alle macchine in un cluster.

La metrica può avere i seguenti stati:

  • SUCCESS: Memorystore for Redis Cluster ha eseguito la rotazione del certificato.
  • FAILED: Memorystore for Redis Cluster non ha eseguito la rotazione del certificato perché non è disponibile, non dispone delle autorizzazioni per eseguire la rotazione o si è verificato un errore interno.
  • SKIPPED: Memorystore for Redis Cluster ha saltato la rotazione del certificato perché non deve essere ruotato.

Metriche di Cloud Monitoring

Questa sezione elenca e descrive le metriche di Cloud Monitoring disponibili per Memorystore for Redis Cluster.

Metriche a livello di cluster

Queste metriche forniscono una panoramica generale dell'integrità e delle prestazioni complessive di un cluster. Puoi utilizzare le metriche per comprendere la capacità e l'utilizzo complessivi di un cluster, nonché per identificare potenziali colli di bottiglia o aree di miglioramento.

Nome metrica Descrizione
redis.googleapis.com/cluster/clients/average_connected_clients Questa metrica misura il numero medio di connessioni client attive a un cluster in un periodo di tempo specificato. Puoi utilizzare la metrica per monitorare lo scaling delle connessioni, identificare i colli di bottiglia delle applicazioni e assicurarti che il cluster sia stabile.
redis.googleapis.com/cluster/clients/maximum_connected_clients Questa metrica mostra il numero massimo di connessioni client attive in tutti i nodi di un cluster. Puoi utilizzare la metrica per monitorare il carico di connessione più elevato sul cluster in qualsiasi momento. Ciò è fondamentale per garantire un rendimento elevato per il cluster, perché un numero elevato di connessioni può aumentare i tempi di risposta.
redis.googleapis.com/cluster/clients/total_connected_clients Questa metrica monitora il numero attuale di connessioni client attive a un cluster. Puoi utilizzarla per monitorare il carico del tuo database ed evitare limiti di connessione.
redis.googleapis.com/cluster/stats/total_connections_received_count Questa metrica mostra il numero cumulativo di connessioni client create in un cluster nell'ultimo minuto. Puoi utilizzare la metrica per analizzare il carico di traffico, assicurarti che i limiti di connessione non vengano superati e determinare se devi scalare il cluster.
redis.googleapis.com/cluster/stats/total_rejected_connections_count Questa metrica monitora il numero totale di connessioni a un cluster che vengono rifiutate perché è stato raggiunto il limite di maxclients.
redis.googleapis.com/cluster/commandstats/total_usec_count Questa metrica misura il tempo totale della CPU consumato da ogni comando. La metrica indica i microsecondi totali utilizzati, fornendo informazioni dettagliate su prestazioni e latenza di un cluster.
redis.googleapis.com/cluster/commandstats/total_calls_count Questa metrica misura il numero totale di chiamate associate a un comando specifico su un nodo del cluster in un minuto. Per identificare i colli di bottiglia o il traffico elevato su comandi specifici, puoi utilizzare la metrica per monitorare il throughput dei comandi (comandi al minuto) nei nodi primari e di replica.
redis.googleapis.com/cluster/cpu/average_utilization Questa metrica mostra l'utilizzo medio della CPU per un cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per identificare le risorse con provisioning eccessivo o sottoutilizzate, gestire le soglie di scalabilità automatica e rilevare i colli di bottiglia delle prestazioni, con un utilizzo ideale del 40-70%.
redis.googleapis.com/cluster/cpu/maximum_utilization

Questa metrica mostra l'utilizzo di picco della CPU in tutti i nodi di un cluster (da 0,0 a 1,0).

La metrica riepiloga solo gli stati sys_main_thread e user_main_thread. Non include altri stati della CPU (ad esempio sys_children o user_children) disponibili nella metrica /cluster/node/cpu/utilization .

Assicurati che l'utilizzo della CPU non superi 0,8 secondi per il nodo principale e 0,5 secondi per ogni replica designata come replica di lettura. Per saperne di più, consulta le best practice per l'utilizzo della CPU.

redis.googleapis.com/cluster/stats/average_expired_keys Questa metrica misura il numero medio di eventi di scadenza delle chiavi per tutti i nodi principali di un cluster. Puoi utilizzare la metrica per monitorare il numero di chiavi in scadenza.
redis.googleapis.com/cluster/stats/maximum_expired_keys Questa metrica misura il numero massimo di eventi di scadenza delle chiavi che si verificano in tutti i nodi primari di un cluster.
redis.googleapis.com/cluster/stats/total_expired_keys_count Questa metrica monitora il numero totale di eventi di scadenza delle chiavi che si verificano in tutti i nodi principali di un cluster. Puoi utilizzare la metrica per monitorare il numero di chiavi in scadenza.
redis.googleapis.com/cluster/stats/average_evicted_keys Questa metrica monitora il numero medio di chiavi eliminate a causa di vincoli di capacità di memoria negli shard principali di un cluster.
redis.googleapis.com/cluster/stats/maximum_evicted_keys Questa metrica mostra il numero più elevato di chiavi eliminate da un nodo o shard di un cluster primario a causa della capacità di memoria.
redis.googleapis.com/cluster/stats/total_evicted_keys_count Questa metrica mostra il numero totale di chiavi eliminate da un nodo di un cluster primario a causa della capacità di memoria.
redis.googleapis.com/cluster/keyspace/total_keys Questa metrica mostra il numero di chiavi archiviate in un cluster.
redis.googleapis.com/cluster/stats/average_keyspace_hits Questa metrica mostra il numero medio di ricerche riuscite di chiavi in tutti i nodi di un cluster.
redis.googleapis.com/cluster/stats/maximum_keyspace_hits Questa metrica mostra il numero massimo di ricerche riuscite di chiavi in un nodo del cluster. Puoi utilizzare la metrica per monitorare le prestazioni del cluster e identificare potenziali hotspot nel cluster.
redis.googleapis.com/cluster/stats/total_keyspace_hits_count Questa metrica tiene traccia del numero cumulativo di ricerche riuscite di chiavi in tutti i nodi di un cluster.
redis.googleapis.com/cluster/stats/average_keyspace_misses Questa metrica mostra il numero medio di ricerche non riuscite di chiavi in un cluster. Puoi utilizzare la metrica per monitorare la frequenza con cui vengono richieste le chiavi, ma non vengono trovate nella cache.
redis.googleapis.com/cluster/stats/maximum_keyspace_misses Questa metrica mostra il numero massimo di ricerche non riuscite di chiavi in un nodo del cluster.
redis.googleapis.com/cluster/stats/total_keyspace_misses_count Questa metrica mostra il numero totale di ricerche non riuscite di chiavi in tutti i nodi del cluster.
redis.googleapis.com/cluster/memory/average_utilization Questa metrica mostra l'utilizzo medio della memoria in un cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per monitorare la capacità del cluster e per impostare le soglie di avviso. Ad esempio, puoi impostare una soglia di avviso per notificare agli utenti quando la memoria media supera una percentuale specifica (ad esempio, l'80%).
redis.googleapis.com/cluster/memory/maximum_utilization Questa metrica mostra l'utilizzo massimo della memoria in tutti i nodi del cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per identificare quando scalare un cluster. Ti consigliamo di monitorare l'utilizzo per assicurarti che rimanga al di sotto del 100%. In caso di carichi di scrittura elevati, le prestazioni potrebbero peggiorare se questa metrica raggiunge il 65-85%.
redis.googleapis.com/cluster/memory/total_used_memory Questa metrica mostra l'utilizzo totale della memoria di un cluster (in byte). Puoi utilizzare la metrica per monitorare la capacità del cluster.
redis.googleapis.com/cluster/memory/size Questa metrica misura la RAM totale, utilizzata e disponibile in tutti i nodi di un cluster. Puoi utilizzare la metrica per monitorare la capacità del cluster e per evitare errori dei nodi.
redis.googleapis.com/cluster/replication/average_ack_lag Questa metrica mostra il ritardo medio di riconoscimento (in secondi) delle repliche in un cluster. Il ritardo di riconoscimento è un collo di bottiglia sul nodo principale di un cluster.

Questo collo di bottiglia è causato dalle repliche che non riescono a tenere il passo con le informazioni che il nodo primario invia. In questo caso, il nodo primario deve attendere la conferma che le repliche hanno ricevuto le informazioni. Ciò potrebbe rallentare i commit delle transazioni e causare un impatto sulle prestazioni del nodo primario.
redis.googleapis.com/cluster/replication/maximum_ack_lag Questa metrica mostra il ritardo di riconoscimento massimo (in secondi) delle repliche in un cluster.
redis.googleapis.com/cluster/replication/average_offset_diff Questa metrica mostra la differenza media di offset di riconoscimento della replica (in byte) in un cluster.

La differenza di offset di riconoscimento della replica indica il numero di byte che non vengono replicati tra le repliche e i relativi cluster principali.
redis.googleapis.com/cluster/replication/maximum_offset_diff Questa metrica mostra la differenza massima di offset di replica (in byte) in un cluster.

La differenza di offset di replica indica il numero di byte non replicati tra le repliche e i relativi cluster principali.
redis.googleapis.com/cluster/stats/total_net_input_bytes_count Questa metrica mostra il conteggio dei byte di rete in entrata ricevuti dagli endpoint di un cluster.
redis.googleapis.com/cluster/stats/total_net_output_bytes_count Questa metrica mostra il conteggio dei byte di rete in uscita inviati dagli endpoint di un cluster.

Metriche a livello di nodo

Queste metriche offrono informazioni dettagliate sullo stato e sul rendimento dei singoli nodi all'interno di un cluster. Puoi utilizzarle per risolvere i problemi relativi ai nodi e ottimizzarne il rendimento.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/clients/connected_clients Questa metrica indica il numero di connessioni client attive a un nodo del cluster, escluse le connessioni di replica. Puoi utilizzare la metrica per monitorare i limiti di connessione e per identificare gli hotspot in cui uno shard riceve un traffico sproporzionato.
redis.googleapis.com/cluster/node/clients/blocked_clients Questa metrica mostra il numero di connessioni client bloccate da un nodo del cluster. Un numero elevato o in rapido aumento di connessioni client bloccate potrebbe indicare che molti client sono in attesa di operazioni. Ciò può comportare un aumento della latenza.
redis.googleapis.com/cluster/node/server/uptime Questa metrica misura l'uptime di un nodo del cluster. Puoi utilizzare la metrica per monitorare per quanto tempo un server viene eseguito ininterrottamente senza riavvii o errori.
redis.googleapis.com/cluster/node/stats/connections_received_count Questa metrica monitora il numero totale di connessioni client create su un nodo del cluster in un periodo di tempo specificato. Puoi utilizzare la metrica per monitorare il traffico di connessione ai singoli nodi all'interno di un cluster. Di conseguenza, puoi analizzare la distribuzione del carico e identificare i picchi di attività di connessione.
redis.googleapis.com/cluster/node/stats/rejected_connections_count Questa metrica mostra il numero di connessioni rifiutate perché un nodo del cluster raggiunge il limite di maxclients. Puoi utilizzare la metrica per identificare se un nodo è sotto pressione per un numero elevato di connessioni e rifiuta nuove connessioni perché non può gestirne altre.
redis.googleapis.com/cluster/node/commandstats/usec_count Questa metrica mostra il tempo totale impiegato da ogni comando in un nodo del cluster. Puoi utilizzarla per analizzare le prestazioni dei comandi, identificare i comandi lenti e risolvere i problemi di latenza a livello di nodo.
redis.googleapis.com/cluster/node/commandstats/calls_count Questa metrica monitora il numero totale di chiamate per un comando su un nodo del cluster al minuto. Puoi utilizzare la metrica per monitorare la distribuzione del traffico, identificare i comandi più utilizzati e risolvere i colli di bottiglia sui singoli nodi.
redis.googleapis.com/cluster/node/cpu/utilization Questa metrica mostra l'utilizzo della CPU per un nodo del cluster (da 0,0 a 1,0).
redis.googleapis.com/cluster/node/stats/expired_keys_count Questa metrica mostra il numero totale di eventi di scadenza in un nodo del cluster. Puoi utilizzarla per monitorare la velocità con cui le chiavi vengono rimosse dal cluster perché il durata (TTL) raggiunge lo zero.
redis.googleapis.com/cluster/node/stats/evicted_keys_count Questa metrica conteggia il numero totale di chiavi che un nodo del cluster espelle perché il cluster raggiunge il limite massimo di memoria. La metrica può identificare se un cluster è sotto pressione della memoria. Un numero elevato o in aumento di chiavi rimosse indica che un cluster sta esaurendo lo spazio. Di conseguenza, il cluster rimuove le chiavi per fare spazio a nuovi dati.
redis.googleapis.com/cluster/node/keyspace/total_keys Questa metrica misura il numero totale di chiavi archiviate da un nodo del cluster. La metrica fornisce visibilità sulla distribuzione e sullo sharding dei dati tra i nodi.
redis.googleapis.com/cluster/node/stats/keyspace_hits_count Questa metrica monitora il numero di ricerche di chiavi riuscite su un nodo del cluster. Puoi utilizzare la metrica per monitorare l'efficienza con cui il nodo deve recuperare i dati in memoria.
redis.googleapis.com/cluster/node/stats/keyspace_misses_count Questa metrica monitora il numero di ricerche di chiavi non riuscite su un nodo del cluster.
redis.googleapis.com/cluster/node/memory/utilization Questa metrica monitora l'utilizzo di memoria in un nodo del cluster (da 0,0 a 1,0). Puoi utilizzare la metrica per prevenire i guasti dei nodi e garantire la stabilità di un cluster.
redis.googleapis.com/cluster/node/memory/usage Questa metrica misura la memoria utilizzata totale di un nodo del cluster.
redis.googleapis.com/cluster/node/stats/net_input_bytes_count Questa metrica misura il numero totale di byte di rete in entrata che un nodo del cluster riceve. Puoi utilizzare la metrica per monitorare il throughput di rete, identificare potenziali colli di bottiglia e analizzare i picchi di traffico sul nodo.
redis.googleapis.com/cluster/node/stats/net_output_bytes_count Questa metrica misura il numero totale di byte di rete in uscita inviati da un nodo del cluster. Puoi utilizzare la metrica per monitorare il volume di uscita di rete per il nodo a scopo di ottimizzazione delle prestazioni e pianificazione della capacità.
redis.googleapis.com/cluster/node/replication/offset Questa metrica misura i byte di offset di replica di un nodo del cluster. Prima di promuovere le repliche di un cluster a cluster primari, puoi utilizzare la metrica per verificare se le repliche hanno elaborato tutti i dati. In questo modo si evita la perdita di dati.
redis.googleapis.com/cluster/node/server/healthy Questa metrica determina se un nodo del cluster è disponibile e funziona correttamente.
redis.googleapis.com/cluster/node/stats/evicted_clients_count Questa metrica monitora il numero totale di client che Memorystore for Redis Cluster disconnette perché la memoria aggregata consumata da tutti i buffer client supera una soglia di memoria predefinita. Puoi utilizzare la metrica come meccanismo di protezione per impedire l'utilizzo eccessivo della memoria utilizzata da parte dei client, che potrebbe esaurire la memoria del server e causare arresti anomali.
redis.googleapis.com/cluster/node/clients/tracking_clients Questa metrica monitora il numero di client Redis attivi registrati per ricevere messaggi di monitoraggio e invalidazione lato server. Puoi utilizzare la metrica per monitorare ed eseguire il debug delle implementazioni della memorizzazione nella cache lato client per assicurarti che il monitoraggio lato server funzioni come previsto.
redis.googleapis.com/cluster/node/clients/maxclients Questa metrica mostra il numero massimo di connessioni client simultanee che Memorystore for Redis Cluster consente su un nodo del cluster.
redis.googleapis.com/cluster/node/clients/recent_max_input_buffer Questa metrica indica il buffer di memoria più grande (in byte) utilizzato per elaborare un singolo comando client in entrata tra tutte le connessioni attive. Puoi utilizzare la metrica per monitorare la stabilità della connessione ed evitare l'aumento della memoria. Se la dimensione del buffer di input di un client specifico raggiunge costantemente i limiti, ciò può causare blocchi di rete o interruzioni delle connessioni in tutto il cluster.
redis.googleapis.com/cluster/node/clients/recent_max_output_buffer Questa metrica misura l'elenco di output più lungo (in byte) tra le connessioni client più recenti a un server. La metrica è un indicatore fondamentale dell'integrità del server perché identifica i client che richiedono grandi quantità di dati più velocemente di quanto il server possa inviarli.
redis.googleapis.com/cluster/node/commandstats/rejected_calls_count La metrica mostra il numero di comandi (chiamate) Redis che un server rifiuta prima dell'esecuzione. Queste chiamate vengono attivate da precondizioni, ad esempio errori di sintassi nel comando o esecuzione di comandi con limiti di memoria quando l'istanza è in esaurimento della memoria (OOM).
redis.googleapis.com/cluster/node/commandstats/failed_calls_count Questa metrica monitora il numero di operazioni non riuscite su un nodo del cluster. Puoi utilizzare la metrica per valutare se l'applicazione client passa parametri impropri o non è sincronizzata con lo schema del set di dati. Inoltre, puoi diagnosticare se un aumento degli errori è correlato al degrado dei comandi.
redis.googleapis.com/cluster/node/keyspace/keys_with_expiration Questa metrica tiene traccia del numero di chiavi attive in un cluster che hanno impostato un time-to-live (TTL) o un timestamp di scadenza. Puoi utilizzare la metrica per monitorare i limiti di memorizzazione nella cache, la memoria utilizzata e la gestione delle sessioni.
redis.googleapis.com/cluster/node/memory/dataset_usage Questa metrica misura la quantità di memoria utilizzata dai set di dati o dagli oggetti di dati primari in un nodo del cluster.
redis.googleapis.com/cluster/node/memory/mem_not_counted_for_evict

Questa metrica mostra la quantità di memoria che un server esclude quando valuta la memoria necessaria per l'eliminazione delle chiavi.

Quando Memorystore for Redis Cluster calcola se deve eliminare le chiavi, confronta la memoria totale allocata (used_memory) con il limite maxmemory configurato. Tuttavia, il valore di mem_not_counted_for_evict viene sottratto da questa equazione.

redis.googleapis.com/cluster/node/memory/number_of_cached_scripts Questa metrica monitora il numero totale di script EVAL che un server memorizza nella cache su un nodo del cluster. Puoi utilizzare la metrica per monitorare l'overhead associato agli script Lua nel cluster.
redis.googleapis.com/cluster/node/memory/number_of_functions Questa metrica monitora il numero totale di funzioni definite in un nodo cluster.
redis.googleapis.com/cluster/node/memory/lua_usage Questa metrica monitora il numero di byte utilizzati da Lua per gli script EVAL su un nodo del cluster.
redis.googleapis.com/cluster/node/memory/replica_clients_usage

Questa metrica monitora la quantità di memoria (in byte) consumata dai client di replica su un nodo del cluster. La metrica misura la memoria utilizzata dai client di replica.

Poiché i buffer delle repliche condividono la memoria con il backlog di replica, la metrica può segnalare un valore di 0 quando le repliche non attivano un aumento della memoria utilizzata oltre a quella allocata per il backlog.

redis.googleapis.com/cluster/node/memory/normal_clients_usage Questa metrica monitora la quantità di memoria (in byte) utilizzata dai client non di replica su un nodo del cluster. La metrica misura il consumo di memoria dalle connessioni client non di replica.
redis.googleapis.com/cluster/node/memory/peak_usage Questa metrica monitora la memoria di picco consumata da Memorystore for Redis Cluster su un nodo del cluster. La metrica misura la quantità massima di memoria (in byte) utilizzata da Memorystore for Redis Cluster dall'ultimo avvio.
redis.googleapis.com/cluster/node/memory/rss_usage

Questa metrica monitora l'utilizzo delle dimensioni del set residente (RSS) di Memorystore for Redis Cluster su un nodo del cluster. La metrica rappresenta il numero di byte allocati da Memorystore for Redis Cluster.

Il monitoraggio dell'utilizzo di RSS è fondamentale perché riflette l'utilizzo effettivo della RAM fisica, quindi può rilevare una frammentazione elevata della memoria. Ad esempio, se l'RSS si avvicina al limite del container del cluster, ciò può causare problemi di esaurimento della memoria.

redis.googleapis.com/cluster/node/memory/scripts_usage Questa metrica monitora l'overhead di memoria associato agli script su un nodo del cluster. La metrica misura il numero di byte di overhead della memoria utilizzati dalla funzione EVAL. Questa memoria è considerata parte della used_memory complessiva del cluster.
redis.googleapis.com/cluster/node/memory/maxmemory_policy Questa metrica monitora la configurazione dei criteri di espulsione per un nodo del cluster. La metrica indica l'impostazione maxmemory-policy attuale per il nodo, che determina il modo in cui Memorystore for Redis Cluster seleziona le chiavi per l'eliminazione quando raggiunge il limite maxmemory.
redis.googleapis.com/cluster/node/persistence/aof_enabled Questa metrica indica se la persistenza del file di tipo Append-Only File (AOF) è attivata su un nodo del cluster.
redis.googleapis.com/cluster/node/persistence/async_loading Questa metrica indica se Memorystore for Redis Cluster carica un set di dati di replica in modo asincrono mentre gestisce i dati esistenti. La metrica monitora lo stato in cui Memorystore for Redis Cluster carica il set di dati. Ciò si verifica quando la configurazione repl-diskless-load è abilitata e impostata su swapdb.
redis.googleapis.com/cluster/node/persistence/loading Questa metrica indica se Memorystore for Redis Cluster carica un file di dump su un nodo del cluster. Puoi utilizzare la metrica per valutare se Memorystore for Redis Cluster carica i dati da un archivio permanente, ad esempio uno snapshot del database Redis (RDB) o un file AOF.
redis.googleapis.com/cluster/node/persistence/current_cow_peak

Questa metrica monitora l'utilizzo massimo della memoria associato alle operazioni di copia in scrittura (COW) durante un processo di fork figlio su un nodo del cluster. La metrica misura la dimensione massima (in byte) della memoria COW durante l'esecuzione di un fork figlio. Ciò si verifica durante le operazioni che comportano la creazione di fork del processo, ad esempio la creazione di uno snapshot RDB o l'esecuzione di una riscrittura AOF.

Il monitoraggio delle dimensioni massime di COW è importante per la pianificazione della capacità e per prevenire problemi di esaurimento della memoria, perché la memoria utilizzata totale del nodo aumenta durante il processo di fork della quantità di dati modificati mentre il fork è attivo.

redis.googleapis.com/cluster/node/persistence/current_cow_size

Questa metrica monitora le dimensioni attuali della memoria COW mentre un processo figlio fork è attivo su un nodo del cluster. La metrica misura le dimensioni (in byte) della memoria copiata durante un processo di fork, ad esempio la creazione di uno snapshot RDB o l'esecuzione di una riscrittura AOF.

Puoi utilizzare la metrica per monitorare l'overhead di memoria in tempo reale di un fork in corso.

redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_time_sec

Questa metrica monitora la durata dell'ultima operazione di salvataggio in background (BGSAVE) per un RDB su un nodo del cluster. La metrica misura il tempo (in secondi) impiegato per completare l'ultima operazione di salvataggio RDB.

Puoi utilizzare la metrica per monitorare l'impatto sul rendimento delle operazioni di persistenza, soprattutto durante gli eventi di manutenzione o di scalabilità orizzontale.

redis.googleapis.com/cluster/node/persistence/rdb_last_cow_size

Questa metrica monitora le dimensioni della memoria COW durante l'ultima operazione di salvataggio RDB su un nodo del cluster. La metrica misura la quantità di memoria (in byte) copiata durante la creazione dell'ultimo snapshot RDB in background.

Puoi utilizzare la metrica per eseguire il debug di potenziali problemi con le sincronizzazioni complete durante la manutenzione o gli aggiornamenti della configurazione, perché la metrica fornisce informazioni sull'overhead di memoria del processo di persistenza.

redis.googleapis.com/cluster/node/persistence/current_fork_percentage Questa metrica monitora l'avanzamento del processo di fork corrente su un nodo del cluster. La metrica indica la percentuale di completamento delle operazioni di fork attive, ad esempio quelle utilizzate per gli snapshot RDB o le riscritture AOF.
redis.googleapis.com/cluster/node/persistence/aof_rewrite_in_progress Questa metrica fornisce uno stato in tempo reale (1 per vero e 0 per falso) che indica se Memorystore for Redis Cluster esegue una riscrittura AOF su un nodo del cluster. Puoi utilizzare la metrica per determinare se le operazioni AOF in background contribuiscono ad aumenti notevoli di latenza o memoria utilizzata. Le operazioni di riscrittura possono attivare picchi di carico transitori.
redis.googleapis.com/cluster/node/persistence/aof_last_cow_size

Questa metrica monitora le dimensioni della memoria COW utilizzata durante l'ultima operazione di riscrittura AOF su un nodo del cluster. La metrica misura la quantità di memoria (in byte) che Memorystore for Redis Cluster copia durante l'ultima riscrittura AOF in background.

Puoi utilizzare la metrica per monitorare le dimensioni della memoria COW durante le operazioni di persistenza. Ciò è fondamentale per la pianificazione della capacità, perché l'utilizzo totale della memoria del nodo aumenta durante il processo di fork della quantità di dati modificati mentre il fork è attivo. Se non gestisci la memoria COW, potresti riscontrare problemi di esaurimento della memoria per il cluster.

redis.googleapis.com/cluster/node/persistence/aof_last_rewrite_time_sec Questa metrica misura la durata (in secondi) dell'operazione di riscrittura AOF in background più recente per il completamento su un nodo del cluster. Puoi utilizzare la metrica per valutare l'impatto sulle prestazioni della persistenza AOF in background e per comprendere la durata dei picchi di carico temporanei causati dalle operazioni di riscrittura.
redis.googleapis.com/cluster/node/errorstats/errors_count Questa metrica fornisce una visualizzazione granulare degli errori derivati dalla sezione ERRORSTATS delle statistiche interne di Memorystore for Redis Cluster. La metrica misura la variazione del conteggio degli errori in un intervallo.
redis.googleapis.com/cluster/node/stats/acl_access_denied_auths_count Questa metrica indica il numero totale di errori di autenticazione con accesso negato dell'elenco dicontrollo dell'accessoo dell'accesso (ACL) in un intervallo.
redis.googleapis.com/cluster/node/stats/expire_cycle_cpu_millisecond_count Questa metrica misura la quantità cumulativa di tempo della CPU speso per i cicli di scadenza attivi in un intervallo.
redis.googleapis.com/cluster/node/stats/expired_keys_percentage Questa metrica mostra la percentuale stimata di chiavi scadute in un determinato momento. La metrica fornisce informazioni sul processo di scadenza. Se la percentuale è costantemente elevata, Memorystore for Redis Cluster potrebbe non allocare cicli di CPU in background sufficienti per stare al passo con la velocità di scadenza delle chiavi.
redis.googleapis.com/cluster/node/stats/expired_time_cap_reached_count Questa metrica misura il conteggio cumulativo dei cicli che hanno raggiunto il limite di tempo in un intervallo. Un valore elevato o in aumento per la metrica spesso è correlato a un elevato utilizzo della memoria utilizzata da parte delle chiavi scadute. Per mantenere l'integrità del set di dati, potrebbero essere necessari più cicli di CPU in background.
redis.googleapis.com/cluster/node/stats/pubsub_channels Questa metrica mostra il numero globale di canali Pub/Sub che hanno abbonamenti client.
redis.googleapis.com/cluster/node/stats/pubsub_patterns Questa metrica mostra il numero globale di pattern Pub/Sub che hanno abbonamenti client.
redis.googleapis.com/cluster/node/stats/pubsubshard_channels Questa metrica mostra il numero globale di canali shard Pub/Sub che hanno abbonamenti client.
redis.googleapis.com/cluster/node/stats/total_fork_count

Questa metrica misura la variazione del numero totale di fork in un intervallo. La metrica è un indicatore chiave dell'attività in background di Memorystore for Redis Cluster.

Puoi utilizzare la metrica per monitorare la frequenza di fork per la pianificazione della capacità, perché ogni processo di fork coinvolge la memoria COW. La memoria COW aumenta il footprint della memoria complessivo di un nodo del cluster.

redis.googleapis.com/cluster/node/stats/tracking_total_keys Questa metrica mostra il numero di chiavi monitorate da Memorystore for Redis Cluster. La metrica è un componente della funzionalità di monitoraggio lato server, che consente ai client di mantenere una cache locale che viene invalidata quando le chiavi cambiano in Memorystore for Redis Cluster.
redis.googleapis.com/cluster/node/stats/tracking_total_items Questa metrica mostra il numero totale di elementi monitorati da Memorystore for Redis Cluster. La metrica rappresenta la somma di tutti i client che guardano ogni chiave.
redis.googleapis.com/cluster/node/stats/tracking_total_prefixes Questa metrica mostra il numero di prefissi monitorati nella tabella prefix di Memorystore for Redis Cluster.
redis.googleapis.com/cluster/node/stats/latest_fork_usec Questa metrica mostra la durata dell'ultima operazione di fork (in microsecondi).
redis.googleapis.com/cluster/node/replication/primary_sync_in_progress

Questa metrica mostra se un cluster primario si sta sincronizzando con una replica. Un valore 1 indica che la sincronizzazione è in corso, mentre un valore 0 indica che il cluster non si sta sincronizzando con la replica.

Puoi utilizzare la metrica per risolvere i problemi di coerenza dei dati e comprendere l'avanzamento degli eventi di scalabilità orizzontale o manutenzione.

redis.googleapis.com/cluster/node/replication/sync_partial_ok_count Questa metrica misura il numero di tentativi di risincronizzazione parziale riusciti.
redis.googleapis.com/cluster/node/replication/sync_partial_err_count

Questa metrica misura il numero di tentativi di risincronizzazione parziale non riusciti.

Puoi utilizzare la metrica come indicatore dello stato della replica. Quando una risincronizzazione parziale non va a buon fine, la replica deve eseguire una risincronizzazione completa. Ciò comporta la creazione di uno snapshot RDB sul cluster primario e il trasferimento dell'intero set di dati sulla rete.

redis.googleapis.com/cluster/node/replication/sync_full_count

Questa metrica misura la variazione del numero di risincronizzazioni complete che un cluster primario ha con una replica. Una risincronizzazione completa si verifica quando una risincronizzazione parziale non va a buon fine. Ciò accade quando il backlog di replica sul cluster primario non è sufficientemente grande da contenere i dati persi dalla replica durante una disconnessione.

Puoi utilizzare la metrica per diagnosticare i problemi di integrità e capacità della replica per il cluster.

redis.googleapis.com/cluster/node/memory/maxmemory

Questa metrica riflette l'impostazione di configurazione maxmemory per un nodo del cluster, ovvero la quantità massima di memoria che Memorystore for Redis Cluster può utilizzare. Questa impostazione determina quando Memorystore for Redis Cluster inizia a eliminare le chiavi, in base all'impostazione configurata per maxmemory-policy.

Puoi utilizzare la metrica per la pianificazione della capacità e la risoluzione dei problemi di esaurimento della memoria, poiché definisce il limite superiore della memoria utilizzata per l'archiviazione dei dati e l'overhead del server.

Per ulteriori informazioni sulle impostazioni maxmemory e maxmemory-policy, vedi Parametri di configurazione modificabili.

Metriche di replica tra regioni

Questa sezione elenca e descrive le metriche di replica tra regioni.

Nome metrica Descrizione
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links Questa metrica mostra il numero di link di shard tra i cluster primario e secondario. All'interno di un gruppo di replica tra regioni, un cluster primario segnala il numero di link di replica CRR che ha con i cluster secondari del gruppo. Per ogni cluster secondario, questo numero dovrebbe essere uguale al numero di shard. Se, inaspettatamente, il numero scende al di sotto del numero di shard, questo identifica il numero di shard in cui la replica tra il replicatore e il follower è cessata. In uno stato ideale, questa metrica dovrebbe avere lo stesso numero del conteggio degli shard del cluster primario.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff Questa metrica misura la differenza massima di offset di replica (in byte) tra gli shard primari e secondari (replica) di un cluster in diverse regioni.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff Questa metrica misura la differenza media di offset di replica (in byte) tra gli shard primari e di replica di un cluster in diverse regioni. Valori elevati per la metrica indicano un ritardo di replica, che puoi risolvere mettendo in pausa e riprendendo la replica.

Metriche JSON

Questa sezione elenca le metriche a livello di nodo per i documenti JSON.

Metriche a livello di nodo

Queste metriche offrono informazioni dettagliate sul numero totale di documenti JSON e sulla quantità di memoria che consumano.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/json/documents_count Questa metrica misura il numero totale di documenti JSON che si trovano su un nodo del cluster. Puoi utilizzare la metrica per monitorare la distribuzione e la capacità dei dati, perché mostra il numero di documenti indicizzati, eliminati o uniti a livello di nodo.
redis.googleapis.com/cluster/node/json/used_memory Questa metrica misura la quantità di memoria (in byte o come percentuale della memoria disponibile) utilizzata dai documenti JSON. Puoi utilizzare la metrica per monitorare la capacità, identificare i nodi con limiti di memoria e attivare azioni di scalabilità.

Metriche di persistenza

Questa sezione elenca e descrive le metriche di persistenza.

Metriche di persistenza RDB

Questa sezione elenca e descrive le metriche di persistenza RDB.

Metriche a livello di cluster

Questa sezione elenca e descrive le metriche di persistenza RDB a livello di cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/persistence/rdb_saves_count

Questa metrica tiene traccia del numero cumulativo di volte in cui viene acquisita un'istantanea di persistenza RDB (nota anche come salvataggio RDB) su un nodo del cluster. Puoi utilizzare la metrica per monitorare la frequenza e il successo degli snapshot RDB in base al nodo.

La metrica ha un campo status_code. Per verificare se uno snapshot RDB non va a buon fine, filtra il campo status_code in base allo stato 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/persistence/rdb_save_ages Questa metrica mostra l'età di un'istantanea di distribuzione per tutti i nodi di un cluster. In caso di incidente di ripristino, puoi utilizzare la metrica per visualizzare il periodo di tempo per l'obsolescenza dei dati. Idealmente, la distribuzione ha valori con un tempo di ritardo inferiore (o uguale) alla frequenza delle istantanee.

Metriche a livello di nodo

Nome metrica Descrizione
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress Questa metrica indica se un salvataggio in background RDB (BGSAVE) è attivo su un nodo del cluster. Uno stato TRUE indica che BGSAVE è attivo.
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status Questa metrica indica se l'operazione BGSAVE su un nodo del cluster è stata completata o ha generato un errore. Lo stato TRUE indica che l'operazione è stata completata.
redis.googleapis.com/cluster/node/persistence/rdb_saves_count Questa metrica monitora il numero cumulativo di snapshot RDB creati su un nodo del cluster. Puoi utilizzare la metrica per monitorare la frequenza e il successo degli snapshot sul nodo.
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age Questa metrica misura il tempo, in secondi, trascorso dall'ultimo snapshot RDB riuscito. Puoi utilizzare la metrica per monitorare l'obsolescenza dei dati di persistenza RDB su un nodo del cluster.
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until Questa metrica misura il tempo rimanente, in secondi, fino al successivo snapshot RDB pianificato su un nodo del cluster. Puoi utilizzare la metrica per monitorare la pianificazione della persistenza RDB e tenere traccia di quando viene eseguito il successivo snapshot automatico.
redis.googleapis.com/cluster/node/persistence/current_save_keys_total Questa metrica monitora il numero totale di chiavi elaborate nell'operazione di salvataggio RDB corrente su un nodo del cluster.

Metriche di persistenza AOF

Questa sezione elenca e descrive le metriche di persistenza AOF.

Metriche a livello di cluster

Questa sezione elenca e descrive le metriche di persistenza AOF a livello di cluster.

Nome metrica Descrizione
redis.googleapis.com/cluster/persistence/aof_fsync_lags

Questa metrica misura la differenza di tempo (o ritardo) per tutti i nodi di un cluster che passa tra la scrittura dei dati nel file AOF e il momento in cui questi dati vengono sincronizzati correttamente con l'archiviazione durevole.

Quando il parametro appendfsync è impostato su everysec, puoi utilizzare la metrica per valutare l'integrità della persistenza per il cluster. Idealmente, la distribuzione del ritardo deve avere valori con un tempo di ritardo inferiore (o uguale) alla frequenza di sincronizzazione dell'AOF.

redis.googleapis.com/cluster/persistence/aof_rewrite_count

Questa metrica monitora il numero cumulativo di volte in cui un nodo del cluster attiva un'operazione di riscrittura AOF. Puoi utilizzare la metrica per diagnosticare problemi di rendimento, perché un'alta frequenza di riscritture AOF potrebbe causare picchi di latenza o pressione della memoria sul cluster.

La metrica ha un campo status_code. Per verificare se le riscritture AOF non vanno a buon fine, filtra questo campo in base allo stato 3 - INTERNAL_ERROR.

Metriche a livello di nodo

Questa sezione elenca e descrive le metriche di persistenza AOF a livello di nodo.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/persistence/aof_last_write_status Questa metrica mostra lo stato dell'ultima operazione di scrittura nel file AOF su un nodo del cluster. Se lo stato è TRUE, l'operazione di scrittura è riuscita. Puoi utilizzare la metrica per verificare che Memorystore for Redis Cluster mantenga i dati correttamente.
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status Questa metrica mostra lo stato dell'ultima operazione AOF bgrewrite su un nodo del cluster. Se lo stato è TRUE, l'operazione è riuscita.
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

Questa metrica misura la differenza di tempo (o ritardo) per un nodo del cluster che passa tra la scrittura dei dati nel file AOF e il momento in cui i dati vengono sincronizzati correttamente con l'archiviazione durevole.

Quando il parametro appendfsync è impostato su everysec, puoi utilizzare la metrica per valutare l'integrità della persistenza per il nodo. Se il processo di sincronizzazione dei dati richiede più di 1 secondo, la persistenza è in ritardo rispetto ai dati in entrata, il che può comportare un calo delle prestazioni o la perdita di dati in caso di arresto anomalo.

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

Questa metrica monitora il numero cumulativo di volte in cui un nodo del cluster attiva un'operazione di riscrittura AOF. Puoi utilizzare la metrica per diagnosticare i problemi di prestazioni. Frequenze elevate di riscrittura AOF possono comportare un aumento della latenza o della pressione della memoria sul cluster.

La metrica ha un campo status_code. Per verificare se le riscritture AOF non vanno a buon fine, filtra questo campo in base allo stato 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count Questa metrica monitora il numero cumulativo di volte in cui la chiamata di sistema AOF fsync() non va a buon fine su un nodo del cluster. La metrica è applicabile solo ai cluster abilitati per AOF in cui il parametro appendfsync è impostato su everysec o always.

Metriche di persistenza comuni

Questa sezione elenca e descrive le metriche applicabili sia alla persistenza AOF sia a quella RDB.

Metriche a livello di nodo

Questa sezione elenca e descrive le metriche di persistenza AOF e RDB a livello di nodo.

Nome metrica Descrizione
redis.googleapis.com/cluster/node/persistence/auto_restore_count

Questa metrica tiene traccia del numero cumulativo di volte in cui un nodo del cluster viene ripristinato automaticamente da un file di dump della persistenza (AOF o RDB).

La metrica ha un campo status_code. Per verificare se i ripristini non vanno a buon fine, filtra questo campo in base allo stato 3 - INTERNAL_ERROR.

Esempi di casi d'uso per le metriche di persistenza

Questa sezione descrive esempi di casi d'uso per le metriche di persistenza AOF e RDB.

Controllare se le operazioni di scrittura AOF causano latenza e pressione della memoria

Supponiamo che rilevi un aumento della latenza o della memoria utilizzata in un cluster o in un nodo all'interno del cluster. In questo caso, controlla se l'utilizzo aggiuntivo è correlato alla persistenza AOF.

Le operazioni di riscrittura AOF possono attivare picchi di carico temporanei. Ti consigliamo di esaminare la metrica aof_rewrites_count perché fornisce il conteggio cumulativo delle riscritture AOF durante il ciclo di vita del cluster o del nodo del cluster.

Supponiamo che questa metrica mostri che gli incrementi nel conteggio delle riscritture corrispondono a un aumento della latenza. Per ridurre la frequenza delle riscritture, riduci la velocità di scrittura o aumenta il conteggio degli shard.

Controlla se le operazioni di salvataggio RDB causano latenza e pressione della memoria

Supponiamo che rilevi un aumento della latenza o della memoria utilizzata in un cluster o in un nodo all'interno del cluster. In questo caso, controlla se l'utilizzo aggiuntivo è correlato alla persistenza RDB.

Le operazioni di salvataggio RDB possono attivare picchi di carico temporanei. Ti consigliamo di esaminare la metrica rdb_saves_count perché fornisce il conteggio cumulativo dei salvataggi RDB durante il ciclo di vita del cluster o del nodo del cluster.

Supponiamo che questa metrica mostri che gli incrementi nel conteggio dei salvataggi RDB corrispondono a un aumento della latenza. Per ridurre la frequenza dei salvataggi RDB, aumenta l'intervallo dello snapshot RDB. Inoltre, per ridurre i livelli di carico di base, esegui lo scale out del cluster.

Interpretare le metriche per Memorystore for Redis Cluster

Molte metriche appartengono alle seguenti categorie: media, massimo e totale.

Forniamo le variazioni media e massima della stessa metrica in modo che tu possa utilizzare entrambe le metriche per identificare i punti caldi per quella famiglia di metriche.

Il valore totale della metrica è indipendente dalle variazioni media e massima della metrica. Questo valore fornisce approfondimenti separati e non correlati allo scopo delle variazioni per gli hotspot.

Informazioni sulle metriche media e massima

Supponiamo di confrontare i valori delle metriche average_keyspace_hits e maximum_keyspace_hits per un cluster. Man mano che la differenza tra le due metriche aumenta, una differenza maggiore indica più hotspot per gli hit nel cluster. Un valore simile tra le metriche indica che gli hit sono distribuiti in modo più uniforme tra i nodi del cluster.

Questo principio si applica a tutte le metriche che presentano le varianti media e massima della stessa metrica.

Esempio di hotspot

Se confronti i valori delle metriche average_keyspace_hits e maximum_keyspace_hits per tutti gli shard di un cluster, puoi determinare in quali shard si verificano gli hotspot. Ad esempio, supponiamo che gli shard di un cluster di sei shard abbiano il seguente numero di hit:

  • Shard 1 - 2 hit
  • Shard 2 - 2 colpi
  • Shard 3 – 2 colpi
  • Shard 4 - 2 colpi
  • Shard 5 – 2 colpi
  • Shard 6-8 hits

In questo esempio, la metrica average_keyspace_hits restituisce un valore pari a 3, mentre la metrica maximum_keyspace_hits restituisce un valore pari a 8. Gli hit non sono distribuiti in modo uniforme tra gli shard del cluster. Lo shard 6 è un hotspot perché gestisce una quantità di traffico sproporzionatamente elevata.