Métriques de surveillance acceptées

Cette page répertorie les métriques disponibles pour Memorystore pour Redis Cluster et décrit ce que chacune mesure.

Métriques de sauvegarde

Cette section liste et décrit les métriques backup et import.

Métriques au niveau du cluster

Cette section liste et décrit les métriques de sauvegarde et d'importation au niveau du cluster.

Nom de la métrique Description
redis.googleapis.com/cluster/backup/last_backup_start_time Cette métrique indique l'heure de début de la dernière opération de sauvegarde.
redis.googleapis.com/cluster/backup/last_backup_status Cette métrique indique si la dernière tentative de sauvegarde a réussi ou échoué. Les états sont 1 pour Success et 0 pour Failed.
redis.googleapis.com/cluster/backup/last_backup_duration Cette métrique indique la durée de la dernière opération de sauvegarde (en millisecondes).
redis.googleapis.com/cluster/backup/last_backup_size Cette métrique indique la taille de la dernière sauvegarde (en octets). Cette métrique est un indicateur clé pour surveiller l'efficacité des sauvegardes et planifier la capacité de stockage.
redis.googleapis.com/cluster/import/last_import_start_time Cette métrique indique l'heure de début de la dernière opération d'importation.
redis.googleapis.com/cluster/import/last_import_duration Cette métrique indique la durée de la dernière opération d'importation (en millisecondes).

Métriques de l'autorité de certification (AC)

Cette section liste les métriques associées aux autorités de certification (CA) gérées par le client.

Métriques au niveau du cluster

Ces métriques offrent une vue d'ensemble des certificats associés aux machines d'un cluster.

Nom de la métrique Description
redis.googleapis.com/cluster/security/rotate_tls_cert_count

Cette métrique indique l'état des certificats renouvelables associés aux machines d'un cluster.

La métrique peut avoir les états suivants :

  • SUCCESS : Memorystore for Redis Cluster a fait pivoter le certificat.
  • FAILED : Memorystore pour Redis Cluster n'a pas fait pivoter le certificat, car il n'est pas disponible, Memorystore pour Redis Cluster n'a pas les autorisations nécessaires pour le faire pivoter ou une erreur interne s'est produite.
  • SKIPPED : Memorystore for Redis Cluster a ignoré la rotation du certificat, car elle n'est pas nécessaire.

Métriques Cloud Monitoring

Cette section liste et décrit les métriques Cloud Monitoring disponibles pour Memorystore pour Redis Cluster.

Métriques au niveau du cluster

Ces métriques fournissent une vue d'ensemble de l'état et des performances globales d'un cluster. Vous pouvez utiliser les métriques pour comprendre la capacité et l'utilisation globales d'un cluster, ainsi que pour identifier les goulots d'étranglement potentiels ou les points à améliorer.

Nom de la métrique Description
redis.googleapis.com/cluster/clients/average_connected_clients Cette métrique mesure le nombre moyen de connexions clientes actives à un cluster au cours d'une période spécifiée. Vous pouvez utiliser la métrique pour surveiller la mise à l'échelle des connexions, identifier les goulots d'étranglement des applications et vous assurer que le cluster est stable.
redis.googleapis.com/cluster/clients/maximum_connected_clients Cette métrique indique le nombre maximal de connexions client actives sur tous les nœuds d'un cluster. Vous pouvez utiliser cette métrique pour surveiller la charge de connexion la plus élevée sur le cluster à tout moment. Cette étape est essentielle pour garantir des performances élevées du cluster, car un nombre élevé de connexions peut augmenter les temps de réponse.
redis.googleapis.com/cluster/clients/total_connected_clients Cette métrique suit le nombre actuel de connexions client actives à un cluster. Vous pouvez utiliser cette métrique pour surveiller la charge de votre base de données et éviter les limites de connexion.
redis.googleapis.com/cluster/stats/total_connections_received_count Cette métrique indique le nombre cumulé de connexions client créées dans un cluster au cours de la dernière minute. Vous pouvez utiliser cette métrique pour analyser la charge de trafic, vous assurer de ne pas dépasser les limites de connexion et déterminer si vous devez mettre à l'échelle le cluster.
redis.googleapis.com/cluster/stats/total_rejected_connections_count Cette métrique suit le nombre total de connexions à un cluster qui sont refusées, car la limite maxclients est atteinte.
redis.googleapis.com/cluster/commandstats/total_usec_count Cette métrique mesure le temps CPU total consommé par chaque commande. Cette métrique indique le nombre total de microsecondes utilisées, ce qui donne des informations sur les performances et la latence d'un cluster.
redis.googleapis.com/cluster/commandstats/total_calls_count Cette métrique mesure le nombre total d'appels associés à une commande spécifique sur un nœud de cluster en une minute. Pour identifier les goulots d'étranglement ou le trafic élevé sur des commandes spécifiques, vous pouvez utiliser la métrique pour surveiller le débit des commandes (commandes par minute) sur les nœuds principaux et de réplique.
redis.googleapis.com/cluster/cpu/average_utilization Cette métrique indique l'utilisation moyenne du processeur pour un cluster (de 0,0 à 1,0). Vous pouvez utiliser cette métrique pour identifier les ressources surprovisionnées ou sous-utilisées, gérer les seuils d'autoscaling et détecter les goulots d'étranglement des performances, avec une utilisation idéale de 40 % à 70%.
redis.googleapis.com/cluster/cpu/maximum_utilization

Cette métrique indique le pic d'utilisation du processeur sur tous les nœuds d'un cluster (de 0,0 à 1,0).

La métrique ne résume que les états sys_main_thread et user_main_thread. Il n'inclut pas les autres états du processeur (tels que sys_children ou user_children) qui sont disponibles dans la métrique /cluster/node/cpu/utilization .

Assurez-vous que l'utilisation du processeur ne dépasse pas 0,8 seconde pour le nœud principal et 0,5 seconde pour chaque réplica désigné comme réplica en lecture. Pour en savoir plus, consultez les bonnes pratiques concernant l'utilisation du processeur.

redis.googleapis.com/cluster/stats/average_expired_keys Cette métrique mesure le nombre moyen d'événements d'expiration de clé pour tous les nœuds principaux d'un cluster. Vous pouvez utiliser cette métrique pour surveiller le nombre de clés qui expirent.
redis.googleapis.com/cluster/stats/maximum_expired_keys Cette métrique mesure le nombre maximal d'événements d'expiration de clés qui se produisent sur tous les nœuds principaux d'un cluster.
redis.googleapis.com/cluster/stats/total_expired_keys_count Cette métrique suit le nombre total d'événements d'expiration de clé qui se produisent sur tous les nœuds principaux d'un cluster. Vous pouvez utiliser la métrique pour surveiller le nombre de clés qui expirent.
redis.googleapis.com/cluster/stats/average_evicted_keys Cette métrique suit le nombre moyen de clés évincées en raison des contraintes de capacité mémoire dans les segments principaux d'un cluster.
redis.googleapis.com/cluster/stats/maximum_evicted_keys Cette métrique indique le nombre maximal de clés évincées d'un nœud ou d'un shard d'un cluster primaire en raison de la capacité de mémoire.
redis.googleapis.com/cluster/stats/total_evicted_keys_count Cette métrique indique le nombre total de clés évincées par un nœud d'un cluster principal en raison de la capacité de mémoire.
redis.googleapis.com/cluster/keyspace/total_keys Cette métrique indique le nombre de clés stockées dans un cluster.
redis.googleapis.com/cluster/stats/average_keyspace_hits Cette métrique indique le nombre moyen de recherches de clés réussies sur tous les nœuds d'un cluster.
redis.googleapis.com/cluster/stats/maximum_keyspace_hits Cette métrique indique le nombre maximal de recherches de clés réussies dans un nœud de cluster. Vous pouvez utiliser cette métrique pour surveiller les performances du cluster et identifier les points chauds potentiels dans le cluster.
redis.googleapis.com/cluster/stats/total_keyspace_hits_count Cette métrique suit le nombre cumulé de recherches de clés réussies sur tous les nœuds d'un cluster.
redis.googleapis.com/cluster/stats/average_keyspace_misses Cette métrique indique le nombre moyen de recherches de clés ayant échoué dans un cluster. Vous pouvez utiliser cette métrique pour suivre la fréquence à laquelle des clés sont demandées, mais ne sont pas trouvées dans le cache.
redis.googleapis.com/cluster/stats/maximum_keyspace_misses Cette métrique indique le nombre maximal de recherches de clés ayant échoué sur un nœud de cluster.
redis.googleapis.com/cluster/stats/total_keyspace_misses_count Cette métrique indique le nombre total d'échecs de recherche de clés sur tous les nœuds du cluster.
redis.googleapis.com/cluster/memory/average_utilization Cette métrique indique l'utilisation moyenne de la mémoire dans un cluster (de 0,0 à 1,0). Vous pouvez utiliser cette métrique pour surveiller la capacité du cluster et définir des seuils d'alerte. Par exemple, vous pouvez définir un seuil d'alerte pour avertir les utilisateurs lorsque la mémoire moyenne dépasse un pourcentage spécifique (par exemple, 80%).
redis.googleapis.com/cluster/memory/maximum_utilization Cette métrique indique l'utilisation maximale de la mémoire sur tous les nœuds du cluster (de 0,0 à 1,0). Vous pouvez utiliser la métrique pour identifier le moment où faire évoluer un cluster. Nous vous recommandons de surveiller l'utilisation pour vous assurer qu'elle reste inférieure à 100%. En cas de charge d'écriture élevée, les performances peuvent se dégrader si cette métrique atteint 65% à 85%.
redis.googleapis.com/cluster/memory/total_used_memory Cette métrique indique l'utilisation totale de la mémoire d'un cluster (en octets). Vous pouvez utiliser cette métrique pour surveiller la capacité du cluster.
redis.googleapis.com/cluster/memory/size Cette métrique mesure la RAM totale, utilisée et disponible sur tous les nœuds d'un cluster. Vous pouvez utiliser cette métrique pour surveiller la capacité du cluster et éviter les défaillances de nœuds.
redis.googleapis.com/cluster/replication/average_ack_lag Cette métrique indique le délai moyen d'accusé de réception (en secondes) des répliques dans un cluster. Le délai d'accusé de réception est un goulot d'étranglement sur le nœud principal d'un cluster.

Ce goulot d'étranglement est dû à ses répliques qui ne peuvent pas suivre le rythme des informations que le nœud principal leur envoie. Dans ce cas, le nœud principal doit attendre la confirmation que les instances répliquées ont reçu les informations. Cela peut ralentir les commits de transaction et avoir un impact sur les performances du nœud principal.
redis.googleapis.com/cluster/replication/maximum_ack_lag Cette métrique indique le délai d'accusé de réception maximal (en secondes) des répliques dans un cluster.
redis.googleapis.com/cluster/replication/average_offset_diff Cette métrique indique la différence moyenne (en octets) entre les décalages de confirmation de la réplication dans un cluster.

La différence de décalage d'accusé de réception de la réplication correspond au nombre d'octets qui ne sont pas répliqués entre les répliques et leurs clusters principaux.
redis.googleapis.com/cluster/replication/maximum_offset_diff Cette métrique indique la différence maximale de décalage de réplication (en octets) dans un cluster.

La différence de décalage de réplication correspond au nombre d'octets non répliqués entre les instances répliquées et leurs clusters principaux.
redis.googleapis.com/cluster/stats/total_net_input_bytes_count Cette métrique indique le nombre d'octets réseau entrants reçus par les points de terminaison d'un cluster.
redis.googleapis.com/cluster/stats/total_net_output_bytes_count Cette métrique indique le nombre d'octets réseau sortants envoyés par les points de terminaison d'un cluster.

Métriques au niveau des nœuds

Ces métriques fournissent des insights détaillés sur l'état et les performances des nœuds individuels d'un cluster. Vous pouvez utiliser les métriques pour résoudre les problèmes liés aux nœuds et optimiser leurs performances.

Nom de la métrique Description
redis.googleapis.com/cluster/node/clients/connected_clients Cette métrique indique le nombre de connexions client actives à un nœud de cluster, à l'exclusion des connexions de réplique. Vous pouvez utiliser cette métrique pour surveiller les limites de connexion et identifier les points chauds où un shard reçoit un trafic disproportionné.
redis.googleapis.com/cluster/node/clients/blocked_clients Cette métrique indique le nombre de connexions client qu'un nœud de cluster bloque. Un nombre élevé ou en augmentation rapide de connexions client bloquées peut indiquer que de nombreux clients sont en attente d'opérations. Cela peut entraîner une latence accrue.
redis.googleapis.com/cluster/node/server/uptime Cette métrique mesure le temps d'activité d'un nœud de cluster. Vous pouvez utiliser la métrique pour suivre la durée pendant laquelle un serveur s'exécute en continu sans redémarrage ni défaillance.
redis.googleapis.com/cluster/node/stats/connections_received_count Cette métrique suit le nombre total de connexions client créées sur un nœud de cluster au cours d'une période spécifiée. Vous pouvez utiliser cette métrique pour surveiller le trafic de connexion vers des nœuds individuels d'un cluster. Vous pouvez ainsi analyser la répartition de la charge et identifier les pics d'activité de connexion.
redis.googleapis.com/cluster/node/stats/rejected_connections_count Cette métrique indique le nombre de connexions refusées, car un nœud de cluster a atteint la limite maxclients. Vous pouvez utiliser cette métrique pour déterminer si un nœud est soumis à une forte pression de connexion et refuse de nouvelles connexions, car il ne peut pas en gérer davantage.
redis.googleapis.com/cluster/node/commandstats/usec_count Cette métrique indique le temps total consommé par chaque commande dans un nœud de cluster. Vous pouvez utiliser cette métrique pour analyser les performances des commandes, identifier les commandes lentes et résoudre les problèmes de latence au niveau des nœuds.
redis.googleapis.com/cluster/node/commandstats/calls_count Cette métrique suit le nombre total d'appels pour une commande sur un nœud de cluster par minute. Vous pouvez utiliser cette métrique pour surveiller la répartition du trafic, identifier les commandes les plus utilisées et résoudre les problèmes de goulots d'étranglement sur les nœuds individuels.
redis.googleapis.com/cluster/node/cpu/utilization Cette métrique indique l'utilisation du processeur pour un nœud de cluster (de 0,0 à 1,0).
redis.googleapis.com/cluster/node/stats/expired_keys_count Cette métrique indique le nombre total d'événements d'expiration dans un nœud de cluster. Vous pouvez utiliser cette métrique pour surveiller la fréquence à laquelle les clés sont supprimées du cluster, car leur valeur TTL (Time To Live) atteint zéro.
redis.googleapis.com/cluster/node/stats/evicted_keys_count Cette métrique comptabilise le nombre total de clés qu'un nœud de cluster évince, car le cluster atteint sa limite de mémoire maximale. Cette métrique peut identifier si un cluster est soumis à une pression de mémoire. Un nombre élevé ou croissant de clés supprimées indique qu'un cluster manque d'espace. Par conséquent, le cluster supprime les clés pour faire de la place aux nouvelles données.
redis.googleapis.com/cluster/node/keyspace/total_keys Cette métrique mesure le nombre total de clés stockées par un nœud de cluster. Cette métrique permet de visualiser la distribution et le partitionnement des données entre les nœuds.
redis.googleapis.com/cluster/node/stats/keyspace_hits_count Cette métrique suit le nombre de recherches de clés réussies sur un nœud de cluster. Vous pouvez utiliser cette métrique pour surveiller l'efficacité du nœud pour récupérer les données en mémoire.
redis.googleapis.com/cluster/node/stats/keyspace_misses_count Cette métrique suit le nombre de recherches de clés ayant échoué sur un nœud de cluster.
redis.googleapis.com/cluster/node/memory/utilization Cette métrique suit l'utilisation de la mémoire dans un nœud de cluster (de 0,0 à 1,0). Vous pouvez utiliser cette métrique pour éviter les défaillances de nœuds et assurer la stabilité d'un cluster.
redis.googleapis.com/cluster/node/memory/usage Cette métrique mesure l'utilisation totale de la mémoire d'un nœud de cluster.
redis.googleapis.com/cluster/node/stats/net_input_bytes_count Cette métrique mesure le nombre total d'octets réseau entrants qu'un nœud de cluster reçoit. Vous pouvez utiliser cette métrique pour surveiller le débit réseau, identifier les goulots d'étranglement potentiels et analyser les pics de trafic sur le nœud.
redis.googleapis.com/cluster/node/stats/net_output_bytes_count Cette métrique mesure le nombre total d'octets réseau sortants qu'un nœud de cluster envoie. Vous pouvez utiliser cette métrique pour surveiller le volume de trafic sortant du réseau pour le nœud à des fins d'optimisation des performances et de planification de la capacité.
redis.googleapis.com/cluster/node/replication/offset Cette métrique mesure les octets de décalage de réplication d'un nœud de cluster. Avant de promouvoir les répliques d'un cluster en clusters principaux, vous pouvez utiliser la métrique pour vérifier si les répliques ont traité toutes les données. Cela permet d'éviter toute perte de données.
redis.googleapis.com/cluster/node/server/healthy Cette métrique détermine si un nœud de cluster est disponible et fonctionne correctement.

Métriques de réplication interrégionale

Cette section liste et décrit les métriques de la réplication interrégionale.

Nom de la métrique Description
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links Cette métrique indique le nombre de liens de partition entre les clusters principal et secondaire. Dans un groupe de réplication interrégionale, un cluster principal indique le nombre de liens de réplication CRR qu'il possède avec les clusters secondaires du groupe. Pour chaque cluster secondaire, ce nombre devrait être égal au nombre de partitions. Si, de manière inattendue, le nombre tombe en dessous du nombre de partitions, cela indique le nombre de partitions où la réplication entre le réplicateur et le follower a cessé. Dans un état idéal, cette métrique doit avoir le même nombre que le nombre de partitions du cluster principal.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff Cette métrique mesure la différence maximale de décalage de réplication (en octets) entre les shards principaux et secondaires (répliqués) d'un cluster dans différentes régions.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff Cette métrique mesure la différence moyenne de décalage de réplication (en octets) entre les shards principaux et répliqués d'un cluster dans différentes régions. Des valeurs élevées pour cette métrique indiquent un décalage de réplication, que vous pouvez résoudre en mettant en veille, puis en reprenant la réplication.

Métriques JSON

Cette section liste les métriques au niveau des nœuds pour les documents JSON.

Métriques au niveau des nœuds

Ces métriques fournissent des informations détaillées sur le nombre total de documents JSON et la quantité de mémoire qu'ils consomment.

Nom de la métrique Description
redis.googleapis.com/cluster/node/json/documents_count Cette métrique mesure le nombre total de documents JSON situés sur un nœud de cluster. Vous pouvez utiliser cette métrique pour suivre la distribution et la capacité des données, car elle indique le nombre de documents indexés, supprimés ou fusionnés au niveau du nœud.
redis.googleapis.com/cluster/node/json/used_memory Cette métrique mesure la quantité de mémoire (en octets ou en pourcentage de la mémoire disponible) consommée par les documents JSON. Vous pouvez utiliser cette métrique pour surveiller la capacité, identifier les nœuds liés à la mémoire et déclencher des actions de scaling.

Métriques de persistance

Cette section liste et décrit les métriques de persistance.

Métriques de persistance RDB

Cette section liste et décrit les métriques de persistance de la base de données Redis (RDB).

Métriques au niveau du cluster

Cette section liste et décrit les métriques de persistance RDB au niveau du cluster.

Nom de la métrique Description
redis.googleapis.com/cluster/persistence/rdb_saves_count

Cette métrique suit le nombre cumulé de fois où un instantané de persistance RDB (également appelé sauvegarde RDB) est effectué sur un nœud de cluster. Vous pouvez utiliser cette métrique pour surveiller la fréquence et la réussite des instantanés RDB au niveau de chaque nœud.

La métrique comporte un champ status_code. Pour vérifier si un instantané RDB a échoué, filtrez le champ status_code sur l'état 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/persistence/rdb_save_ages Cette métrique indique l'ancienneté d'un instantané de distribution pour tous les nœuds d'un cluster. En cas d'incident de récupération, vous pouvez utiliser la métrique pour afficher le délai d'obsolescence des données. Dans l'idéal, la distribution doit comporter des valeurs dont le temps de latence est inférieur (ou égal) à la fréquence de vos instantanés.

Métriques au niveau des nœuds

Nom de la métrique Description
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress Cette métrique indique si un enregistrement RDB en arrière-plan (BGSAVE) est actif sur un nœud de cluster. L'état TRUE signifie que BGSAVE est actif.
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status Cette métrique indique si l'opération BGSAVE sur un nœud de cluster s'est terminée ou a rencontré une erreur. L'état TRUE signifie que l'opération est terminée.
redis.googleapis.com/cluster/node/persistence/rdb_saves_count Cette métrique suit le nombre cumulé d'instantanés RDB créés sur un nœud de cluster. Vous pouvez utiliser cette métrique pour surveiller la fréquence et la réussite des instantanés sur le nœud.
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age Cette métrique mesure le temps, en secondes, écoulé depuis le dernier instantané RDB réussi. Vous pouvez utiliser cette métrique pour surveiller la fraîcheur des données de persistance RDB sur un nœud de cluster.
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until Cette métrique mesure le temps restant, en secondes, avant la prochaine planification d'un instantané RDB sur un nœud de cluster. Vous pouvez utiliser cette métrique pour surveiller la planification de la persistance RDB et suivre la date du prochain instantané automatique.
redis.googleapis.com/cluster/node/persistence/current_save_keys_total Cette métrique suit le nombre total de clés traitées lors de l'opération d'enregistrement RDB actuelle sur un nœud de cluster.

Métriques de persistance de l'AOF

Cette section liste et décrit les métriques de persistance des fichiers en mode Ajout uniquement (AOF).

Métriques au niveau du cluster

Cette section liste et décrit les métriques de persistance AOF au niveau du cluster.

Nom de la métrique Description
redis.googleapis.com/cluster/persistence/aof_fsync_lags

Cette métrique mesure la différence de temps (ou le décalage) pour tous les nœuds d'un cluster qui s'écoule entre l'écriture des données dans le fichier AOF et la synchronisation réussie de ces données dans un espace de stockage durable.

Lorsque le paramètre appendfsync est défini sur everysec, vous pouvez utiliser la métrique pour évaluer l'état de la persistance du cluster. Dans l'idéal, vous souhaitez que la distribution du décalage ait des valeurs de décalage inférieures (ou égales) à la fréquence de synchronisation de l'AOF.

redis.googleapis.com/cluster/persistence/aof_rewrite_count

Cette métrique suit le nombre cumulé de fois où un nœud de cluster déclenche une opération de réécriture AOF. Vous pouvez utiliser cette métrique pour diagnostiquer les problèmes de performances, car une fréquence élevée de réécriture AOF peut entraîner des pics de latence ou une pression sur la mémoire du cluster.

La métrique comporte un champ status_code. Pour vérifier si les réécritures AOF échouent, filtrez ce champ sur l'état 3 - INTERNAL_ERROR.

Métriques au niveau des nœuds

Cette section liste et décrit les métriques de persistance AOF au niveau des nœuds.

Nom de la métrique Description
redis.googleapis.com/cluster/node/persistence/aof_last_write_status Cette métrique indique l'état de la dernière opération d'écriture dans le fichier AOF sur un nœud de cluster. Si l'état est TRUE, l'opération d'écriture a réussi. Vous pouvez utiliser cette métrique pour vérifier que Memorystore pour Redis Cluster conserve bien les données.
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status Cette métrique indique l'état de la dernière opération bgrewrite AOF sur un nœud de cluster. Si l'état est TRUE, l'opération a réussi.
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

Cette métrique mesure la différence de temps (ou le décalage) pour un nœud de cluster qui s'écoule entre l'écriture des données dans l'AOF et la synchronisation réussie de ces données dans un stockage durable.

Lorsque le paramètre appendfsync est défini sur everysec, vous pouvez utiliser la métrique pour évaluer l'état de la persistance du nœud. Si le processus de synchronisation des données prend plus d'une seconde, la persistance est en retard par rapport aux données entrantes, ce qui peut entraîner une dégradation des performances ou une perte de données en cas de plantage.

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

Cette métrique suit le nombre cumulé de fois où un nœud de cluster déclenche une opération de réécriture AOF. Vous pouvez utiliser cette métrique pour diagnostiquer les problèmes de performances. Des réécritures fréquentes du fichier AOF peuvent entraîner une augmentation de la latence ou une saturation de la mémoire sur le cluster.

La métrique comporte un champ status_code. Pour vérifier si les réécritures AOF échouent, filtrez ce champ sur l'état 3 - INTERNAL_ERROR.

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count Cette métrique suit le nombre cumulé d'échecs de l'appel système fsync() AOF sur un nœud de cluster. Cette métrique ne s'applique qu'aux clusters pour lesquels le paramètre appendfsync est défini sur everysec ou always.

Métriques de persistance courantes

Métriques applicables aux mécanismes de persistance AOF et RDB.

Métriques au niveau des nœuds

Nom de la métrique Description
redis.googleapis.com/cluster/node/persistence/auto_restore_count Cette métrique indique le nombre de restaurations à partir du fichier de vidage (AOF ou RDB).

Exemples de cas d'utilisation pour les métriques de persistance

Vérifier si les opérations d'écriture AOF entraînent une latence et une pression sur la mémoire

Supposons que vous détectiez une latence ou une utilisation de la mémoire accrues sur votre cluster ou sur le nœud du cluster. Dans ce cas, vous pouvez vérifier si l'utilisation supplémentaire est liée à la persistance AOF.

Comme vous savez que les opérations de réécriture AOF peuvent déclencher des pics de charge transitoires, vous pouvez inspecter la métrique aof_rewrites_count, qui vous donne le nombre cumulé de réécritures AOF sur la durée de vie du cluster ou du nœud dans le cluster. Supposons que cette métrique vous montre que les incréments du nombre de réécritures correspondent à des augmentations de la latence. Dans ce cas, vous pouvez résoudre le problème en réduisant le taux d'écriture ou en augmentant le nombre de segments pour réduire la fréquence des réécritures.

Vérifier si les opérations d'enregistrement RDB entraînent une latence et une pression sur la mémoire

Supposons que vous détectiez une latence ou une utilisation de la mémoire accrues sur votre cluster ou sur le nœud du cluster. Dans ce cas, vous pouvez vérifier si l'utilisation supplémentaire est liée à la persistance RDB.

Comme vous savez que les opérations d'enregistrement RDB peuvent déclencher des pics de charge transitoires, vous pouvez inspecter la métrique rdb_saves_count, qui indique le nombre cumulé d'enregistrements RDB pendant la durée de vie du cluster ou du nœud dans le cluster. Supposons que cette métrique vous montre que les incréments du nombre d'enregistrements RDB correspondent à des augmentations de la latence. Dans ce cas, vous pouvez réduire l'intervalle de snapshot RDB pour diminuer la fréquence des réécritures. Vous pouvez également effectuer un scaling horizontal du cluster pour réduire les niveaux de charge de référence.

Interpréter les métriques pour Memorystore for Redis Cluster

Comme vous pouvez le voir dans la liste ci-dessus, de nombreuses métriques partagent trois catégories : moyenne, maximum et total.

Pour Memorystore pour Redis Cluster, nous fournissons des variantes moyennes et maximales de la même métrique. Vous pouvez ainsi utiliser les deux métriques pour identifier les points chauds de cette famille de métriques.

La valeur totale de la métrique est indépendante et fournit des insights distincts sans rapport avec l'objectif des variantes moyenne et maximum pour les points chauds.

Comprendre les métriques moyennes et maximales

Supposons que vous compariez les valeurs average_keyspace_hits et maximum_keyspace_hits de votre cluster. Plus la différence entre les deux métriques est importante, plus cela indique qu'il y a de points chauds pour les hits dans votre cluster. Une valeur proche de average_keyspace_hits et de maximum_keyspace_hits indique que les hits sont répartis plus uniformément dans votre cluster.

Ce principe s'applique à toutes les métriques qui présentent des variations moyenne et maximale de la même métrique.

Exemple de zone cliquable

Si vous comparez average_keyspace_hits et maximum_keyspace_hits pour tous les shards de votre cluster, vous pouvez identifier les points chauds. Par exemple, supposons que les fragments d'un cluster à six fragments présentent le nombre de résultats suivant :

  • Partition 1 : deux hits
  • Segment 2 : deux résultats
  • Segment 3 : deux résultats
  • Partition 4 – 2 hits
  • Partition 5 : deux résultats
  • Partition 6 à 8 hits

Dans cet exemple, average_keyspace_hits renvoie la valeur 3 et maximum_keyspace_hits renvoie la valeur 8, ce qui indique que le shard 6 est actif.

Nous fournissons des métriques au niveau des nœuds que vous pouvez utiliser pour identifier les points chauds du cluster.