지원되는 모니터링 측정항목

이 페이지에서는 Memorystore for Redis Cluster에 사용할 수 있는 측정항목을 나열하고 각 측정항목이 측정하는 대상을 설명합니다.

백업 측정항목

이 섹션에서는 백업가져오기 측정항목을 나열하고 설명합니다.

클러스터 수준 측정항목

이 섹션에서는 클러스터 수준 백업 및 가져오기 측정항목을 나열하고 설명합니다.

측정항목 이름 설명
redis.googleapis.com/cluster/backup/last_backup_start_time 이 측정항목은 마지막 백업 작업의 시작 시간을 보여줍니다.
redis.googleapis.com/cluster/backup/last_backup_status 이 측정항목은 가장 최근의 백업 시도가 성공적으로 완료되었는지 아니면 실패했는지를 보여줍니다. 상태는 Success의 경우 1이고 Failed의 경우 0입니다.
redis.googleapis.com/cluster/backup/last_backup_duration 이 측정항목은 마지막 백업 작업의 기간 (밀리초)을 보여줍니다.
redis.googleapis.com/cluster/backup/last_backup_size 이 측정항목은 마지막 백업의 크기 (바이트)를 보여줍니다. 이 측정항목은 백업 효율성과 스토리지 용량 계획을 모니터링하는 주요 지표입니다.
redis.googleapis.com/cluster/import/last_import_start_time 이 측정항목은 마지막 가져오기 작업의 시작 시간을 보여줍니다.
redis.googleapis.com/cluster/import/last_import_duration 이 측정항목은 마지막 가져오기 작업의 기간 (밀리초)을 보여줍니다.

인증 기관 (CA) 측정항목

이 섹션에는 고객 관리 인증 기관 (CA)와 연결된 측정항목이 나열되어 있습니다.

클러스터 수준 측정항목

이러한 측정항목은 클러스터의 머신과 연결된 인증서에 대한 개략적인 개요를 제공합니다.

측정항목 이름 설명
redis.googleapis.com/cluster/security/rotate_tls_cert_count

이 측정항목은 클러스터의 머신과 연결된 인증서의 순환 상태를 보여줍니다.

측정항목은 다음 상태를 가질 수 있습니다.

  • SUCCESS: Memorystore for Redis Cluster에서 인증서를 순환했습니다.
  • FAILED: 인증서를 사용할 수 없거나, Memorystore for Redis Cluster에 인증서를 순환할 권한이 없거나, 내부 오류가 있어 Memorystore for Redis Cluster에서 인증서를 순환하지 않았습니다.
  • SKIPPED: 인증서를 회전할 필요가 없으므로 Memorystore for Redis Cluster에서 인증서 회전을 건너뛰었습니다.

Cloud Monitoring 측정항목

이 섹션에서는 Memorystore for Redis Cluster에 사용할 수 있는 Cloud Monitoring 측정항목을 나열하고 설명합니다.

클러스터 수준 측정항목

이러한 측정항목은 클러스터의 전반적인 상태와 성능을 간략하게 보여줍니다. 측정항목을 사용하여 클러스터의 전체 용량과 사용률을 파악하고 잠재적인 병목 현상이나 개선이 필요한 영역을 식별할 수 있습니다.

측정항목 이름 설명
redis.googleapis.com/cluster/clients/average_connected_clients 이 측정항목은 지정된 시간 동안 클러스터에 대한 활성 클라이언트 연결의 평균 수를 측정합니다. 이 측정항목을 사용하여 연결 확장/축소를 모니터링하고, 애플리케이션 병목 현상을 식별하고, 클러스터가 안정적인지 확인할 수 있습니다.
redis.googleapis.com/cluster/clients/maximum_connected_clients 이 측정항목은 클러스터의 모든 노드에서 활성 클라이언트 연결의 최대 수를 보여줍니다. 이 측정항목을 사용하여 언제든지 클러스터의 가장 높은 연결 부하를 모니터링할 수 있습니다. 연결 수가 많으면 응답 시간이 늘어날 수 있으므로 클러스터의 높은 성능을 보장하는 데 중요합니다.
redis.googleapis.com/cluster/clients/total_connected_clients 이 측정항목은 클러스터에 대한 현재 활성 클라이언트 연결 수를 추적합니다. 이 측정항목을 사용하여 데이터베이스의 부하를 모니터링하고 연결 제한을 방지할 수 있습니다.
redis.googleapis.com/cluster/stats/total_connections_received_count 이 측정항목은 지난 1분 동안 클러스터에서 생성된 클라이언트 연결의 누적 수를 보여줍니다. 이 측정항목을 사용하여 트래픽 부하를 분석하고, 연결 한도를 초과하지 않는지 확인하고, 클러스터를 확장해야 하는지 확인할 수 있습니다.
redis.googleapis.com/cluster/stats/total_rejected_connections_count 이 측정항목은 maxclients 한도에 도달하여 거부된 클러스터 연결의 총수를 추적합니다.
redis.googleapis.com/cluster/commandstats/total_usec_count 이 측정항목은 각 명령어가 소비하는 총 CPU 시간을 측정합니다. 이 측정항목은 사용된 총 마이크로초를 나타내며, 클러스터의 성능과 지연 시간에 대한 유용한 정보를 제공합니다.
redis.googleapis.com/cluster/commandstats/total_calls_count 이 측정항목은 클러스터 노드에서 1분 동안 특정 명령어와 연결된 총 호출 수를 측정합니다. 특정 명령어의 병목 현상이나 높은 트래픽을 식별하려면 이 측정항목을 사용하여 기본 노드와 복제본 노드 전반에서 명령어 처리량 (분당 명령어 수)을 모니터링하면 됩니다.
redis.googleapis.com/cluster/cpu/average_utilization 이 측정항목은 클러스터의 평균 CPU 사용률을 보여줍니다 (0.0~1.0). 이 측정항목을 사용하여 과도하게 프로비저닝되거나 활용도가 낮은 리소스를 식별하고, 자동 확장 임곗값을 관리하고, 성능 병목 현상을 감지할 수 있습니다. 이상적인 활용도는 40~70%입니다.
redis.googleapis.com/cluster/cpu/maximum_utilization

이 측정항목은 클러스터의 모든 노드에 대한 최대 CPU 사용량을 보여줍니다(0.0~1.0).

측정항목은 sys_main_threaduser_main_thread 상태만 요약합니다. /cluster/node/cpu/utilization 측정항목에서 사용할 수 있는 다른 CPU 상태(예: sys_children 또는 user_children)는 포함되지 않습니다.

CPU 사용률이 기본 노드의 경우 0.8초, 읽기 복제본으로 지정된 각 복제본의 경우 0.5초를 초과하지 않아야 합니다. 자세한 내용은 CPU 사용량 권장사항을 참고하세요.

redis.googleapis.com/cluster/stats/average_expired_keys 이 측정항목은 클러스터의 모든 기본 노드에 대한 평균 키 만료 이벤트 수를 측정합니다. 이 측정항목을 사용하여 만료되는 키의 수를 모니터링할 수 있습니다.
redis.googleapis.com/cluster/stats/maximum_expired_keys 이 측정항목은 클러스터의 모든 기본 노드에서 발생하는 최대 키 만료 이벤트 수를 측정합니다.
redis.googleapis.com/cluster/stats/total_expired_keys_count 이 측정항목은 클러스터의 모든 기본 노드에서 발생하는 총 키 만료 이벤트 수를 추적합니다. 측정항목을 사용하여 만료되는 키의 수를 모니터링할 수 있습니다.
redis.googleapis.com/cluster/stats/average_evicted_keys 이 측정항목은 클러스터의 기본 샤드에서 메모리 용량 제약으로 인해 제거된 평균 키 수를 추적합니다.
redis.googleapis.com/cluster/stats/maximum_evicted_keys 이 측정항목은 메모리 용량으로 인해 기본 클러스터의 노드 또는 샤드에서 제거된 키의 최대 개수를 보여줍니다.
redis.googleapis.com/cluster/stats/total_evicted_keys_count 이 측정항목은 메모리 용량으로 인해 기본 클러스터의 노드에서 제거된 키의 총 개수를 보여줍니다.
redis.googleapis.com/cluster/keyspace/total_keys 이 측정항목은 클러스터에 저장된 키 수를 보여줍니다.
redis.googleapis.com/cluster/stats/average_keyspace_hits 이 측정항목은 클러스터의 모든 노드에서 성공한 평균 키 조회 수를 보여줍니다.
redis.googleapis.com/cluster/stats/maximum_keyspace_hits 이 측정항목은 클러스터 노드에서 키 조회가 성공한 최대 횟수를 보여줍니다. 이 측정항목을 사용하여 클러스터의 성능을 모니터링하고 클러스터 전반에서 잠재적인 핫스팟을 식별할 수 있습니다.
redis.googleapis.com/cluster/stats/total_keyspace_hits_count 이 측정항목은 클러스터의 모든 노드에서 성공한 키 조회 수를 누적으로 추적합니다.
redis.googleapis.com/cluster/stats/average_keyspace_misses 이 측정항목은 클러스터에서 조회에 실패한 평균 키 수를 보여줍니다. 이 측정항목을 사용하여 키가 요청되지만 캐시에서 찾을 수 없는 빈도를 추적할 수 있습니다.
redis.googleapis.com/cluster/stats/maximum_keyspace_misses 이 측정항목은 클러스터 노드에서 조회에 실패한 최대 키 수를 보여줍니다.
redis.googleapis.com/cluster/stats/total_keyspace_misses_count 이 측정항목은 모든 클러스터 노드에서 조회에 실패한 총 키 수를 보여줍니다.
redis.googleapis.com/cluster/memory/average_utilization 이 측정항목은 클러스터 전체의 평균 메모리 사용률을 나타냅니다 (0.0~1.0). 이 측정항목을 사용하여 클러스터의 용량을 모니터링하고 알림 기준점을 설정할 수 있습니다. 예를 들어 평균 메모리가 특정 비율 (예: 80%)을 초과할 때 사용자에게 알리도록 알림 기준점을 설정할 수 있습니다.
redis.googleapis.com/cluster/memory/maximum_utilization 이 측정항목은 모든 클러스터 노드의 최대 메모리 사용률을 보여줍니다 (0.0~1.0). 이 측정항목을 사용하여 클러스터를 확장할 시점을 확인할 수 있습니다. 사용량을 모니터링하여 100% 미만으로 유지하는 것이 좋습니다. 쓰기 부하가 높은 경우 이 측정항목이 65~85%에 도달하면 성능이 저하될 수 있습니다.
redis.googleapis.com/cluster/memory/total_used_memory 이 측정항목은 클러스터의 총 메모리 사용량 (바이트)을 보여줍니다. 이 측정항목을 사용하여 클러스터의 용량을 모니터링할 수 있습니다.
redis.googleapis.com/cluster/memory/size 이 측정항목은 클러스터에 있는 모든 노드의 총 RAM, 사용된 RAM, 사용 가능한 RAM을 측정합니다. 이 측정항목을 사용하여 클러스터의 용량을 모니터링하고 노드 장애를 방지할 수 있습니다.
redis.googleapis.com/cluster/replication/average_ack_lag 이 측정항목은 클러스터 전체에서 복제본의 평균 확인 지연 시간 (초)을 보여줍니다.

승인 지연은 클러스터의 기본 노드에서 병목 현상입니다. 이 병목 현상은 기본 노드에서 전송하는 정보를 따라갈 수 없는 복제본으로 인해 발생합니다. 이 경우 기본 노드는 복제본이 정보를 수신했다는 확인을 기다려야 합니다. 이로 인해 트랜잭션 커밋 속도가 느려지고 기본 노드의 성능이 저하될 수 있습니다.
redis.googleapis.com/cluster/replication/maximum_ack_lag 이 측정항목은 클러스터 전체에서 복제본의 최대 확인 지연 시간 (초)을 보여줍니다.
redis.googleapis.com/cluster/replication/average_offset_diff 이 측정항목은 클러스터 전체의 평균 복제 확인 오프셋 차이 (바이트)를 보여줍니다.

복제 확인 오프셋 차이는 복제본과 기본 클러스터 간에 복제되지 않은 바이트 수를 의미합니다.
redis.googleapis.com/cluster/replication/maximum_offset_diff 이 측정항목은 클러스터 전체의 최대 복제 오프셋 차이 (바이트)를 보여줍니다.

복제 오프셋 차이는 복제본과 기본 클러스터 간에 복제되지 않은 바이트 수를 의미합니다.
redis.googleapis.com/cluster/stats/total_net_input_bytes_count 이 측정항목은 클러스터의 엔드포인트가 수신하는 수신 네트워크 바이트 수를 보여줍니다.
redis.googleapis.com/cluster/stats/total_net_output_bytes_count 이 측정항목은 클러스터의 엔드포인트가 전송하는 아웃바운드 네트워크 바이트 수를 보여줍니다.

노드 수준 측정항목

이러한 측정항목은 클러스터 내 개별 노드의 상태와 성능에 대한 자세한 정보를 제공합니다. 측정항목을 사용하여 노드 문제를 해결하고 성능을 최적화할 수 있습니다.

측정항목 이름 설명
redis.googleapis.com/cluster/node/clients/connected_clients 이 측정항목은 복제본 연결을 제외한 클러스터 노드에 대한 활성 클라이언트 연결 수를 나타냅니다. 이 측정항목을 사용하여 연결 한도를 모니터링하고 샤드가 불균형한 트래픽을 수신하는 핫스팟을 식별할 수 있습니다.
redis.googleapis.com/cluster/node/clients/blocked_clients 이 측정항목은 클러스터 노드에서 차단하는 클라이언트 연결 수를 표시합니다. 차단된 클라이언트 연결 수가 많거나 빠르게 증가하는 경우 많은 클라이언트가 작업을 기다리고 있음을 나타낼 수 있습니다. 이로 인해 지연 시간이 늘어날 수 있습니다.
redis.googleapis.com/cluster/node/server/uptime 이 측정항목은 클러스터 노드의 업타임을 측정합니다. 이 측정항목을 사용하여 재부팅이나 장애 없이 서버가 연속으로 실행되는 시간을 추적할 수 있습니다.
redis.googleapis.com/cluster/node/stats/connections_received_count 이 측정항목은 지정된 기간 내에 클러스터 노드에서 생성된 총 클라이언트 연결 수를 추적합니다. 이 측정항목을 사용하여 클러스터 내 개별 노드로의 연결 트래픽을 모니터링할 수 있습니다. 따라서 부하 분산을 분석하고 연결 활동의 급증을 식별할 수 있습니다.
redis.googleapis.com/cluster/node/stats/rejected_connections_count 이 측정항목은 클러스터 노드가 maxclients 한도에 도달하여 거부된 연결 수를 보여줍니다. 이 측정항목을 사용하여 노드에 연결 압력이 높고 더 많은 연결을 처리할 수 없기 때문에 새 연결을 거부하는지 확인할 수 있습니다.
redis.googleapis.com/cluster/node/commandstats/usec_count 이 측정항목은 클러스터 노드에서 각 명령어가 소비하는 총시간을 보여줍니다. 이 측정항목을 사용하여 명령어의 성능을 분석하고, 느린 명령어를 식별하고, 노드 수준에서 지연 시간 문제를 해결할 수 있습니다.
redis.googleapis.com/cluster/node/commandstats/calls_count 이 측정항목은 클러스터 노드에서 분당 명령어의 총 호출 수를 추적합니다. 이 측정항목을 사용하여 트래픽 분산을 모니터링하고, 많이 사용되는 명령어를 식별하고, 개별 노드의 병목 현상을 해결할 수 있습니다.
redis.googleapis.com/cluster/node/cpu/utilization 이 측정항목은 클러스터 노드의 CPU 사용률을 보여줍니다 (0.0~1.0).
redis.googleapis.com/cluster/node/stats/expired_keys_count 이 측정항목은 클러스터 노드의 총 만료 이벤트 수를 보여줍니다. 이 측정항목을 사용하여 TTL (Time To Live)이 0에 도달하여 클러스터에서 키가 삭제되는 비율을 모니터링할 수 있습니다.
redis.googleapis.com/cluster/node/stats/evicted_keys_count 이 측정항목은 클러스터가 최대 메모리 한도에 도달하여 클러스터 노드가 삭제하는 키의 총수를 집계합니다. 이 측정항목은 클러스터에 메모리 부족이 있는지 식별할 수 있습니다. 제거된 키의 수가 많거나 증가하는 것은 클러스터의 공간이 부족하다는 것을 나타냅니다. 따라서 클러스터는 새 데이터를 위한 공간을 확보하기 위해 키를 삭제합니다.
redis.googleapis.com/cluster/node/keyspace/total_keys 이 측정항목은 클러스터 노드가 저장하는 키의 총수를 측정합니다. 이 측정항목은 노드 간 데이터 분산 및 샤딩에 대한 가시성을 제공합니다.
redis.googleapis.com/cluster/node/stats/keyspace_hits_count 이 측정항목은 클러스터 노드에서 성공한 키 조회 수를 추적합니다. 이 측정항목을 사용하여 노드가 메모리 내 데이터를 가져오는 효율성을 모니터링할 수 있습니다.
redis.googleapis.com/cluster/node/stats/keyspace_misses_count 이 측정항목은 클러스터 노드에서 실패한 키 조회 수를 추적합니다.
redis.googleapis.com/cluster/node/memory/utilization 이 측정항목은 클러스터 노드의 메모리 사용률을 추적합니다 (0.0~1.0). 이 측정항목을 사용하여 노드 장애를 방지하고 클러스터의 안정성을 보장할 수 있습니다.
redis.googleapis.com/cluster/node/memory/usage 이 측정항목은 클러스터 노드의 총 메모리 사용량을 측정합니다.
redis.googleapis.com/cluster/node/stats/net_input_bytes_count 이 측정항목은 클러스터 노드가 수신하는 총 수신 네트워크 바이트 수를 측정합니다. 이 측정항목을 사용하여 네트워크 처리량을 모니터링하고, 잠재적인 병목 현상을 식별하고, 노드의 트래픽 급증을 분석할 수 있습니다.
redis.googleapis.com/cluster/node/stats/net_output_bytes_count 이 측정항목은 클러스터 노드가 전송하는 총 아웃바운드 네트워크 바이트 수를 측정합니다. 이 측정항목을 사용하여 성능 조정 및 용량 계획 목적으로 노드의 네트워크 이그레스 볼륨을 모니터링할 수 있습니다.
redis.googleapis.com/cluster/node/replication/offset 이 측정항목은 클러스터 노드의 복제 오프셋 바이트를 측정합니다. 클러스터의 복제본을 기본 클러스터로 승격하기 전에 이 측정항목을 사용하여 복제본이 모든 데이터를 처리했는지 확인할 수 있습니다. 이렇게 하면 데이터 손실을 방지할 수 있습니다.
redis.googleapis.com/cluster/node/server/healthy 이 측정항목은 클러스터 노드가 사용 가능하고 올바르게 작동하는지 여부를 확인합니다.

리전 간 복제 측정항목

이 섹션에서는 리전 간 복제 측정항목을 나열하고 설명합니다.

측정항목 이름 설명
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links 이 측정항목은 기본 클러스터와 보조 클러스터 간의 샤드 링크 수를 보여줍니다. 리전 간 복제 그룹 내에서 기본 클러스터는 그룹의 보조 클러스터와 연결된 CRR 복제 링크 수를 보고합니다. 각 보조 클러스터의 경우 이 숫자는 샤드 수와 같을 것으로 예상됩니다. 예상치 못하게 수가 샤드 수 아래로 떨어지면 이는 리플리케이터와 팔로어 간 복제가 중단된 샤드 수를 나타냅니다. 이상적인 상태에서는 이 측정항목의 수가 기본 클러스터 샤드 수와 동일해야 합니다.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff 이 측정항목은 여러 리전에 걸쳐 있는 클러스터의 기본 샤드와 보조 (복제본) 샤드 간의 최대 복제 오프셋 차이 (바이트)를 측정합니다.
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff 이 측정항목은 여러 리전에 걸쳐 있는 클러스터의 기본 샤드와 복제본 샤드 간의 평균 복제 오프셋 차이 (바이트)를 측정합니다. 측정항목 값이 높으면 복제 지연이 발생한 것이므로 복제를 일시중지한 후 다시 시작하여 해결할 수 있습니다.

JSON 측정항목

이 섹션에는 JSON 문서의 노드 수준 측정항목이 나열되어 있습니다.

노드 수준 측정항목

이러한 측정항목은 총 JSON 문서 수와 이러한 문서가 사용하는 메모리 양에 관한 자세한 통계를 제공합니다.

측정항목 이름 설명
redis.googleapis.com/cluster/node/json/documents_count 이 측정항목은 클러스터 노드에 있는 총 JSON 문서 수를 측정합니다. 이 측정항목은 노드 수준에서 색인이 생성되거나 삭제되거나 병합된 문서 수를 보여주므로 이 측정항목을 사용하여 데이터 분포와 용량을 추적할 수 있습니다.
redis.googleapis.com/cluster/node/json/used_memory 이 측정항목은 JSON 문서가 사용하는 메모리 양 (바이트 또는 사용 가능한 메모리의 백분율)을 측정합니다. 이 측정항목을 사용하여 용량을 모니터링하고, 메모리 제한 노드를 식별하고, 확장 작업을 트리거할 수 있습니다.

지속성 측정항목

이 섹션에서는 영속성 측정항목을 나열하고 설명합니다.

RDB 지속성 측정항목

이 섹션에서는 Redis 데이터베이스 (RDB) 지속성 측정항목을 나열하고 설명합니다.

클러스터 수준 측정항목

이 섹션에서는 클러스터 수준 RDB 지속성 측정항목을 나열하고 설명합니다.

측정항목 이름 설명
redis.googleapis.com/cluster/persistence/rdb_saves_count

이 측정항목은 클러스터 노드에서 RDB 영속성 스냅샷 (RDB 저장이라고도 함)이 생성된 누적 횟수를 추적합니다. 이 측정항목을 사용하여 노드별로 RDB 스냅샷의 빈도와 성공 여부를 모니터링할 수 있습니다.

측정항목에 status_code 필드가 있습니다. RDB 스냅샷이 실패했는지 확인하려면 status_code 필드를 3 - INTERNAL_ERROR 상태로 필터링합니다.

redis.googleapis.com/cluster/persistence/rdb_save_ages 이 측정항목은 클러스터의 모든 노드에 대한 분포 스냅샷 수명을 보여줍니다. 복구 사고가 발생한 경우 이 측정항목을 사용하여 데이터 비활성 기간을 확인할 수 있습니다. 분포에 스냅샷 빈도보다 지연 시간이 짧거나 동일한 값이 있는 것이 좋습니다.

노드 수준 측정항목

측정항목 이름 설명
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress 이 측정항목은 클러스터 노드에서 RDB 백그라운드 저장(BGSAVE)이 활성 상태인지 여부를 나타냅니다. TRUE 상태는 BGSAVE이 활성 상태임을 의미합니다.
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status 이 측정항목은 클러스터 노드에서 BGSAVE 작업이 완료되었는지 아니면 오류가 발생했는지를 나타냅니다. TRUE 상태는 작업이 완료되었음을 의미합니다.
redis.googleapis.com/cluster/node/persistence/rdb_saves_count 이 측정항목은 클러스터 노드에서 생성된 RDB 스냅샷의 누적 수를 추적합니다. 이 측정항목을 사용하여 노드의 스냅샷 빈도와 성공 여부를 모니터링할 수 있습니다.
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age 이 측정항목은 마지막으로 성공한 RDB 스냅샷 이후 경과된 시간을 초 단위로 측정합니다. 이 측정항목을 사용하여 클러스터 노드에서 RDB 지속성 데이터의 비활성 상태를 모니터링할 수 있습니다.
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until 이 측정항목은 클러스터 노드에서 다음 RDB 스냅샷이 발생할 때까지 남은 시간을 초 단위로 측정합니다. 이 측정항목을 사용하여 RDB 지속성 일정을 모니터링하고 다음 자동 스냅샷이 언제 생성되는지 추적할 수 있습니다.
redis.googleapis.com/cluster/node/persistence/current_save_keys_total 이 측정항목은 클러스터 노드에서 현재 RDB 저장 작업에서 처리된 총 키 수를 추적합니다.

AOF 지속성 측정항목

이 섹션에서는 추가 전용 파일 (AOF) 지속성 측정항목을 나열하고 설명합니다.

클러스터 수준 측정항목

이 섹션에서는 클러스터 수준 AOF 지속성 측정항목을 나열하고 설명합니다.

측정항목 이름 설명
redis.googleapis.com/cluster/persistence/aof_fsync_lags

이 측정항목은 AOF에 데이터를 쓰는 시점과 해당 데이터가 내구성 있는 스토리지에 동기화되는 시점 사이의 시간 차이 (또는 지연)를 클러스터의 모든 노드에 대해 측정합니다.

appendfsync 매개변수가 everysec로 설정된 경우 이 측정항목을 사용하여 클러스터의 영속성 상태를 평가할 수 있습니다. 이상적으로는 지연 분포에 AOF의 동기화 빈도보다 지연 시간이 짧거나 동일한 값이 있는 것이 좋습니다.

redis.googleapis.com/cluster/persistence/aof_rewrite_count

이 측정항목은 클러스터 노드가 AOF 재작성 작업을 트리거한 누적 횟수를 추적합니다. AOF 재작성 빈도가 높으면 클러스터에서 지연 시간 급증이나 메모리 부족이 발생할 수 있으므로 이 측정항목을 사용하여 성능 문제를 진단할 수 있습니다.

측정항목에 status_code 필드가 있습니다. AOF 재작성이 실패하는지 확인하려면 이 필드를 3 - INTERNAL_ERROR 상태로 필터링하면 됩니다.

노드 수준 측정항목

측정항목 이름 설명
redis.googleapis.com/cluster/node/persistence/aof_last_write_status 이 측정항목은 클러스터 노드에서 가장 최근에 실행된 AOF 쓰기의 성공 여부를 보여줍니다. TRUE는 성공을 의미합니다. 쓰기가 발생하지 않은 경우 값이 기본적으로 TRUE일 수 있습니다.
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status 이 측정항목은 클러스터 노드에서 마지막 AOF bgrewrite 작업의 성공 여부를 보여줍니다. TRUE는 성공을 의미합니다. bgrewrite가 발생하지 않은 경우 값이 기본적으로 TRUE일 수 있습니다.
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag 이 측정항목은 클러스터 노드에서 메모리와 영구 스토리지 간의 AOF 지연 시간을 보여줍니다. appendfsync=EVERYSEC인 AOF 지원 클러스터에만 적용됩니다.
redis.googleapis.com/cluster/node/persistence/aof_rewrites_count 이 측정항목은 클러스터 노드에서 발생한 AOF 다시 쓰기 횟수를 보여줍니다. AOF 재작성이 실패하는지 확인하려면 status_code 필드를 3 - INTERNAL_ERROR 오류로 필터링하면 됩니다.
redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count 이 측정항목은 AOF fsync() 호출 오류 수를 보여주며 appendfsync=EVERYSEC|ALWAYS인 AOF 지원 클러스터에만 적용됩니다.

일반적인 지속성 측정항목

AOF 및 RDB 지속성 메커니즘 모두에 적용되는 측정항목입니다.

노드 수준 측정항목

측정항목 이름 설명
redis.googleapis.com/cluster/node/persistence/auto_restore_count 이 측정항목은 덤프 파일 (AOF 또는 RDB)에서 복원된 횟수를 보여줍니다.

지속성 측정항목의 샘플 사용 사례

AOF 쓰기 작업으로 인해 지연 시간 및 메모리 압력이 발생하는지 확인

클러스터 또는 클러스터 내 노드에서 지연 시간 또는 메모리 사용량이 증가한 것으로 감지되었다고 가정해 보겠습니다. 이 경우 추가 사용량이 AOF 지속성과 관련이 있는지 확인해야 할 수 있습니다.

AOF 재작성 작업이 일시적인 로드 급증을 트리거할 수 있으므로 클러스터 또는 클러스터 내 노드의 수명 기간 동안 AOF 재작성의 누적 수를 제공하는 aof_rewrites_count 측정항목을 검사할 수 있습니다. 이 측정항목에서 재작성 횟수의 증가가 지연 시간 증가에 해당한다고 가정해 보겠습니다. 이 경우 쓰기 속도를 줄이거나 샤드 수를 늘려 다시 쓰기 빈도를 줄여 문제를 해결할 수 있습니다.

RDB 저장 작업으로 인해 지연 시간 및 메모리 압력이 발생하는지 확인

클러스터 또는 클러스터 내 노드에서 지연 시간 또는 메모리 사용량이 증가한 것으로 감지되었다고 가정해 보겠습니다. 이 경우 추가 사용량이 RDB 지속성과 관련이 있는지 확인해야 할 수 있습니다.

RDB 저장 작업이 일시적인 로드 급증을 트리거할 수 있으므로 클러스터 또는 클러스터 내 노드의 수명 기간 동안 RDB 저장의 누적 수를 제공하는 rdb_saves_count 측정항목을 검사할 수 있습니다. 이 측정항목에서 RDB 저장 횟수의 증가가 지연 시간 증가에 해당한다고 가정해 보겠습니다. 이 경우 RDB 스냅샷 간격을 줄여 다시 쓰기 빈도를 낮출 수 있습니다. 클러스터를 수평 확장하여 기준 부하 수준을 줄일 수도 있습니다.

Memorystore for Redis Cluster의 측정항목 해석

위 목록에 표시된 것처럼 대부분의 측정항목은 평균, 최대, 총계와 같은 3가지 카테고리를 공유합니다.

Memorystore for Redis 클러스터의 경우 동일한 측정항목의 평균최대 변형이 제공되므로 두 측정항목을 모두 사용하여 해당 측정항목 계열의 핫스팟을 식별할 수 있습니다.

측정항목의 총계 값은 독립적이며 평균최대 변형의 부하 집중 목적과 관련되지 않은 별도의 통계를 제공합니다.

평균 및 최대 측정항목 이해하기

클러스터의 average_keyspace_hitsmaximum_keyspace_hits 값을 비교한다고 가정해 보겠습니다. 두 측정항목의 차이가 커질수록 클러스터의 적중 항목에 대한 핫스팟이 더 많아집니다. average_keyspace_hitsmaximum_keyspace_hits 간의 값이 가까울수록 적중 항목이 클러스터에 더 균일하게 분산됩니다.

이 원칙은 동일한 측정항목의 평균최대 변형이 있는 모든 측정항목에 적용됩니다.

핫스팟 예

클러스터의 모든 샤드에 대해 average_keyspace_hitsmaximum_keyspace_hits 값을 비교하면 핫스팟이 발생하는 위치를 알 수 있습니다. 예를 들어 샤드 6개가 있는 클러스터의 샤드의 적중 횟수가 다음과 같다고 가정해 보겠습니다.

  • 샤드 1 – 2회 적중
  • 샤드 2 – 2회 적중
  • 샤드 3 – 2회 적중
  • 샤드 4 – 2회 적중
  • 샤드 5 – 2회 적중
  • 샤드 6 – 8회 적중

이 예시에서 average_keyspace_hits는 값 3을 반환하고 maximum_keyspace_hits는 8을 반환하여 샤드 6에 부하가 집중된다는 것을 알 수 있습니다.

클러스터의 핫스팟을 식별하는 데 사용할 수 있는 노드 수준 측정항목이 제공됩니다.