支援的監控指標

本頁面列出 Memorystore for Redis Cluster 適用的指標,並說明各項指標的用途。

備份指標

本節列出並說明「備份」和「匯入」指標。

叢集層級指標

本節列出並說明叢集層級的備份和匯入指標。

指標名稱 說明
redis.googleapis.com/cluster/backup/last_backup_start_time 這項指標會顯示上次備份作業的開始時間。
redis.googleapis.com/cluster/backup/last_backup_status 這項指標會顯示最近一次備份嘗試是否成功。狀態分別為 1 (成功) 和 0 (失敗)。SuccessFailed
redis.googleapis.com/cluster/backup/last_backup_duration 這項指標會顯示上次備份作業的時間長度 (以毫秒為單位)。
redis.googleapis.com/cluster/backup/last_backup_size 這項指標會顯示上次備份的大小 (以位元組為單位)。這項指標是監控備份效率和規劃儲存容量的重要指標。
redis.googleapis.com/cluster/import/last_import_start_time 這項指標會顯示上次匯入作業的開始時間。
redis.googleapis.com/cluster/import/last_import_duration 這項指標會顯示上次匯入作業的時間長度 (以毫秒為單位)。

憑證授權單位 (CA) 指標

本節列出與客戶管理的憑證授權單位 (CA) 相關聯的指標。

叢集層級指標

這些指標提供與叢集中的機器相關聯憑證的概略總覽。

指標名稱 說明
redis.googleapis.com/cluster/security/rotate_tls_cert_count

這項指標會顯示與叢集中機器相關聯的輪替憑證狀態。

指標可能處於下列狀態:

  • SUCCESS:Memorystore for Redis Cluster 已輪替憑證。
  • FAILED:Memorystore for Redis Cluster 未輪替憑證,因為憑證無法使用、Memorystore for Redis Cluster 沒有輪替憑證的權限,或發生內部錯誤。
  • SKIPPED:Memorystore for Redis Cluster 跳過憑證輪替作業,因為憑證不需要輪替。

Cloud Monitoring 指標

本節列出並說明適用於 Memorystore for Redis Cluster 的 Cloud Monitoring 指標。

叢集層級指標

這些指標可提供叢集整體健康狀態和效能的高階總覽。您可以使用這些指標瞭解叢集的整體容量和使用率,以及找出潛在瓶頸或可改善之處。

指標名稱 說明
redis.googleapis.com/cluster/clients/average_connected_clients 這項指標會測量指定時間內,叢集的平均有效用戶端連線數。您可以利用這項指標監控連線的資源調度情形、找出應用程式瓶頸,並確保叢集穩定運作。
redis.googleapis.com/cluster/clients/maximum_connected_clients 這項指標會顯示叢集所有節點的連線用戶端數量上限。您可以使用這項指標,隨時監控叢集的最高連線負載。這對確保叢集的高效能至關重要,因為連線數量過多可能會增加回應時間。
redis.googleapis.com/cluster/clients/total_connected_clients 這項指標會追蹤目前連線至叢集的有效用戶端連線數量。您可以使用這項指標監控資料庫的負載,並避免連線限制。
redis.googleapis.com/cluster/stats/total_connections_received_count 這項指標會顯示叢集在過去一分鐘內建立的用戶端連線累計數量。您可以使用這項指標分析流量負載、確保未超過連線限制,並判斷是否需要擴充叢集。
redis.googleapis.com/cluster/stats/total_rejected_connections_count 這項指標會追蹤因達到 maxclients 限制而遭拒的叢集連線總數。
redis.googleapis.com/cluster/commandstats/total_usec_count 這項指標會測量每個指令耗用的 CPU 總時間。這項指標會顯示使用的總微秒數,可深入瞭解叢集的效能和延遲時間。
redis.googleapis.com/cluster/commandstats/total_calls_count 這項指標會評估與叢集節點上特定指令相關聯的呼叫總數 (以分鐘為單位)。如要找出特定指令的瓶頸或高流量,可以使用指標監控主要和副本節點的指令輸送量 (每分鐘的指令數)。
redis.googleapis.com/cluster/cpu/average_utilization 這項指標會顯示叢集的平均 CPU 使用率 (從 0.0 到 1.0)。您可以根據這項指標找出資源過度或未充分配置的情況、管理自動調整資源配置的閾值,以及偵測效能瓶頸,理想的使用率為 40% 至 70%。
redis.googleapis.com/cluster/cpu/maximum_utilization

這項指標會顯示叢集中所有節點的 CPU 尖峰使用率 (從 0.0 到 1.0)。

這項指標只會匯總 sys_main_threaduser_main_thread 狀態,不會納入 /cluster/node/cpu/utilization 指標中的其他 CPU 狀態 (例如 sys_childrenuser_children)。

請確認主要節點的 CPU 使用率不超過 0.8 秒,且每個指定為讀取副本的副本不超過 0.5 秒。詳情請參閱「CPU 使用率最佳做法」。

redis.googleapis.com/cluster/stats/average_expired_keys 這項指標會測量叢集所有主要節點的金鑰到期事件平均數,可用於監控即將到期的金鑰數量。
redis.googleapis.com/cluster/stats/maximum_expired_keys 這項指標會測量叢集所有主要節點中,發生金鑰到期事件的次數上限。
redis.googleapis.com/cluster/stats/total_expired_keys_count 這項指標會追蹤叢集所有主要節點中發生的金鑰到期事件總數。您可以透過這項指標,監控即將過期的金鑰數量。
redis.googleapis.com/cluster/stats/average_evicted_keys 這項指標會追蹤叢集主要分片因記憶體容量限制而遭逐出的平均鍵數。
redis.googleapis.com/cluster/stats/maximum_evicted_keys 這個指標顯示因記憶體容量而從主要叢集的節點或分片中逐出的鍵數量上限。
redis.googleapis.com/cluster/stats/total_evicted_keys_count 這項指標顯示 主要叢集節點因記憶體容量而遭逐出的鍵總數。
redis.googleapis.com/cluster/keyspace/total_keys 這項指標會顯示叢集中儲存的鍵數量。
redis.googleapis.com/cluster/stats/average_keyspace_hits 這項指標顯示叢集中所有節點的平均金鑰成功查閱次數。
redis.googleapis.com/cluster/stats/maximum_keyspace_hits 這項指標會顯示叢集節點中成功查閱鍵的次數上限。您可以使用這項指標監控叢集的效能,並找出叢集中的潛在熱點。
redis.googleapis.com/cluster/stats/total_keyspace_hits_count 這項指標會追蹤叢集內所有節點的累計成功鍵查閱次數。
redis.googleapis.com/cluster/stats/average_keyspace_misses 這項指標會顯示叢集中鍵的平均查閱失敗次數。您可以使用這項指標,追蹤系統要求金鑰但未在快取中找到金鑰的頻率。
redis.googleapis.com/cluster/stats/maximum_keyspace_misses 這項指標顯示叢集節點中,金鑰查閱失敗次數的上限。
redis.googleapis.com/cluster/stats/total_keyspace_misses_count 這項指標顯示所有叢集節點中,鍵查閱失敗的總次數。
redis.googleapis.com/cluster/memory/average_utilization 這項指標會顯示叢集的平均記憶體使用率 (從 0.0 到 1.0)。您可以使用這項指標監控叢集的容量,並設定快訊門檻。舉例來說,您可以設定快訊門檻,在平均記憶體使用率超過特定百分比 (例如 80%) 時通知使用者。
redis.googleapis.com/cluster/memory/maximum_utilization 這項指標顯示所有叢集節點的最高記憶體使用率 (從 0.0 到 1.0)。您可以使用這項指標判斷調度叢集資源的時機。建議您監控使用情況,確保使用率維持在 100% 以下。在高寫入負載下,如果這項指標達到 65% 至 85%,效能可能會降低。
redis.googleapis.com/cluster/memory/total_used_memory 這項指標會顯示叢集的記憶體用量總計 (以位元組為單位)。您可以使用這項指標監控叢集的容量。
redis.googleapis.com/cluster/memory/size 這項指標會測量叢集中所有節點的總 RAM、已用 RAM 和可用 RAM。您可以透過這項指標監控叢集的容量,並防止節點故障。
redis.googleapis.com/cluster/replication/average_ack_lag 這項指標會顯示叢集中副本的平均確認延遲時間 (以秒為單位)。

確認延遲是叢集主要節點的瓶頸。這是因為備用節點無法跟上主要節點傳送的資訊,發生這種情況時,主要節點必須等待副本確認收到資訊。這可能會導致交易提交速度變慢,並對主要節點的效能造成影響。
redis.googleapis.com/cluster/replication/maximum_ack_lag 這項指標顯示叢集中副本的最大確認延遲時間 (以秒為單位)。
redis.googleapis.com/cluster/replication/average_offset_diff 這項指標顯示整個叢集的平均複製確認位移差異 (以位元組為單位)。

「複製確認位移差異」是指備用資源及其主要叢集之間未複製的位元組數。
redis.googleapis.com/cluster/replication/maximum_offset_diff 這項指標顯示叢集內的最大複製偏移差異 (以位元組為單位)。

複製偏移差異是指副本與主要叢集之間未複製的位元組數。
redis.googleapis.com/cluster/stats/total_net_input_bytes_count 這項指標會顯示叢集端點接收的傳入網路位元組數。
redis.googleapis.com/cluster/stats/total_net_output_bytes_count 這項指標會顯示叢集端點傳送的輸出網路位元組數。

節點層級指標

這些指標可提供叢集中個別節點的健康狀態和效能詳細洞察資料,您可使用這些指標排解節點問題,進而提升節點效能。

指標名稱 說明
redis.googleapis.com/cluster/node/clients/connected_clients 這項指標表示叢集節點的有效用戶端連線數量,不包括副本連線。您可以使用這項指標監控連線限制,並找出分片接收不成比例流量的熱點。
redis.googleapis.com/cluster/node/clients/blocked_clients 這項指標會顯示叢集節點封鎖的用戶端連線數量。如果遭到封鎖的用戶端連線數量偏高或快速增加,可能表示許多用戶端都在等待作業。這可能會導致延遲時間增加。
redis.googleapis.com/cluster/node/server/uptime 這項指標會測量叢集節點的正常運作時間。您可以使用這項指標,追蹤伺服器持續運作的時間長度,期間不會重新啟動或發生故障。
redis.googleapis.com/cluster/node/stats/connections_received_count 這項指標會追蹤指定時間內,在叢集節點上建立的用戶端連線總數。您可以使用這項指標,監控叢集內個別節點的連線流量。因此,您可以分析負載分配情形,並找出連線活動的尖峰時段。
redis.googleapis.com/cluster/node/stats/rejected_connections_count 這項指標顯示因叢集節點達到 maxclients 限制而遭拒的連線數。您可以透過這項指標判斷節點是否承受高連線壓力,並因無法處理更多連線而拒絕建立新連線。
redis.googleapis.com/cluster/node/commandstats/usec_count 這項指標會顯示每個指令在叢集節點中耗用的總時間。您可以使用這項指標分析指令的效能、找出速度緩慢的指令,以及排解節點層級的延遲問題。
redis.googleapis.com/cluster/node/commandstats/calls_count 這項指標會追蹤叢集節點上每分鐘的指令呼叫總數。您可以使用這項指標監控流量分配情形、找出使用量大的指令,以及排解個別節點的瓶頸問題。
redis.googleapis.com/cluster/node/cpu/utilization 這項指標會顯示叢集節點的 CPU 使用率 (介於 0.0 和 1.0 之間)。
redis.googleapis.com/cluster/node/stats/expired_keys_count 這項指標會顯示叢集節點中的過期事件總數。您可以利用這項指標監控從叢集中移除鍵的速率,因為鍵的存留時間 (TTL) 已達到零。
redis.googleapis.com/cluster/node/stats/evicted_keys_count 這項指標會計算叢集達到記憶體上限時,叢集節點逐出的鍵總數。這項指標可判斷叢集是否面臨記憶體壓力。如果逐出的鍵數量偏高或持續增加,表示叢集空間不足,因此會移除鍵,為新資料騰出空間。
redis.googleapis.com/cluster/node/keyspace/total_keys 這項指標會評估叢集節點儲存的鍵總數,可讓您瞭解節點間的資料分配和分片情況。
redis.googleapis.com/cluster/node/stats/keyspace_hits_count 這項指標會追蹤叢集節點上成功進行的鍵查閱次數。您可以使用這項指標,監控節點擷取記憶體內資料的效率。
redis.googleapis.com/cluster/node/stats/keyspace_misses_count 這項指標會追蹤叢集節點上失敗的索引鍵查閱次數。
redis.googleapis.com/cluster/node/memory/utilization 這項指標會追蹤叢集節點的記憶體使用率 (從 0.0 到 1.0)。您可以運用這項指標避免節點故障,確保叢集穩定運作。
redis.googleapis.com/cluster/node/memory/usage 這項指標可衡量叢集節點的記憶體用量總計。
redis.googleapis.com/cluster/node/stats/net_input_bytes_count 這項指標會測量叢集節點接收的網路位元組總數。您可以使用這項指標監控網路總處理量、找出潛在瓶頸,以及分析節點上的流量尖峰。
redis.googleapis.com/cluster/node/stats/net_output_bytes_count 這項指標會測量叢集節點傳送的輸出網路位元組總數。您可以使用這項指標監控節點的網路輸出量,以利進行效能調整和容量規劃。
redis.googleapis.com/cluster/node/replication/offset 這項指標會測量叢集節點的複製偏移位元組。將叢集的備用資源升級為主要叢集之前,您可以使用指標檢查備用資源是否已處理所有資料。這可避免資料遺失。
redis.googleapis.com/cluster/node/server/healthy 這項指標會判斷叢集節點是否可用且運作正常。
redis.googleapis.com/cluster/node/stats/evicted_clients_count 這項指標會追蹤 Memorystore for Redis Cluster 斷線的用戶端總數,因為所有用戶端緩衝區消耗的記憶體總量超過預先定義的記憶體門檻。您可以將這項指標做為保護機制,防止用戶端記憶體用量過高,導致伺服器記憶體耗盡並觸發當機。
redis.googleapis.com/cluster/node/clients/tracking_clients 這項指標會追蹤已註冊接收伺服器端追蹤和失效訊息的有效 Redis 用戶端數量。您可以使用這項指標監控及偵錯用戶端快取實作,確保伺服器追蹤功能正常運作。
redis.googleapis.com/cluster/node/clients/maxclients 這項指標會顯示 Memorystore for Redis Cluster 在叢集節點上允許的並行用戶端連線數量上限。
redis.googleapis.com/cluster/node/clients/recent_max_input_buffer 這項指標會回報用於處理所有有效連線中單一傳入用戶端指令的最大記憶體緩衝區空間 (以位元組為單位)。您可以使用這項指標追蹤連線穩定性,並防止記憶體膨脹。如果特定用戶端的輸入緩衝區空間持續達到上限,可能會導致叢集中的網路停滯或連線中斷。
redis.googleapis.com/cluster/node/clients/recent_max_output_buffer 這項指標會測量最近連線至伺服器的用戶端連線中,最長的輸出清單 (以位元組為單位)。這項指標是伺服器健康狀態的重要指標,因為它會找出要求大量資料的用戶端,且這些用戶端要求資料的速度比伺服器傳送資料的速度快。
redis.googleapis.com/cluster/node/commandstats/rejected_calls_count 這項指標會顯示伺服器在執行 Redis 指令 (呼叫) 前拒絕的次數。這些呼叫是由前提條件觸發,例如指令中有語法錯誤,或執行記憶體受限的指令時,執行個體記憶體不足 (OOM)。
redis.googleapis.com/cluster/node/commandstats/failed_calls_count 這項指標會追蹤叢集節點上失敗的作業數量。您可以根據這項指標評估用戶端應用程式是否傳遞不當參數,或是否與資料集結構定義不同步。此外,您也可以診斷失敗次數增加是否與指令效能下降有關。
redis.googleapis.com/cluster/node/keyspace/keys_with_expiration 這項指標會追蹤叢集中設有存留時間 (TTL) 或到期時間戳記的有效鍵數量。您可以使用這項指標監控快取限制、記憶體用量和工作階段管理。
redis.googleapis.com/cluster/node/memory/dataset_usage 這項指標會測量叢集節點中資料集或主要資料物件耗用的記憶體量。
redis.googleapis.com/cluster/node/memory/mem_not_counted_for_evict

這項指標會顯示伺服器在評估鍵收回所需的記憶體時,排除的記憶體量。

Memorystore for Redis Cluster 在計算是否需要逐出鍵時,會比較總分配記憶體 (used_memory) 與設定的 maxmemory 限制。不過,這個方程式會減去 mem_not_counted_for_evict 的值。

redis.googleapis.com/cluster/node/memory/number_of_cached_scripts 這項指標會追蹤伺服器在叢集節點上快取的 EVAL 指令碼總數。您可以使用這項指標,監控叢集中與 Lua 指令碼相關的負荷。
redis.googleapis.com/cluster/node/memory/number_of_functions 這項指標會追蹤叢集節點上定義的函式總數。
redis.googleapis.com/cluster/node/memory/lua_usage 這項指標會追蹤 Lua 在叢集節點上用於指令碼的位元組數。EVAL
redis.googleapis.com/cluster/node/memory/replica_clients_usage

這項指標會追蹤副本用戶端在叢集節點上消耗的記憶體量 (以位元組為單位)。這項指標會評估副本用戶端使用的記憶體。

由於副本緩衝區會與複製積壓工作共用記憶體,因此當副本未觸發記憶體用量增加 (超出為積壓工作分配的記憶體) 時,指標可能會回報 0 值。

redis.googleapis.com/cluster/node/memory/normal_clients_usage 這項指標會追蹤非副本用戶端在叢集節點上使用的記憶體量 (以位元組為單位)。這項指標會測量非副本用戶端連線的記憶體用量。
redis.googleapis.com/cluster/node/memory/peak_usage 這項指標會追蹤 Memorystore for Redis Cluster 在叢集節點上消耗的尖峰記憶體。這項指標會測量自上次啟動以來,Memorystore for Redis Cluster 使用的最大記憶體量 (以位元組為單位)。
redis.googleapis.com/cluster/node/memory/rss_usage

這項指標會追蹤叢集節點上 Memorystore for Redis Cluster 的常駐集大小 (RSS) 用量。這項指標代表 Memorystore for Redis Cluster 分配的位元組數。

監控 RSS 用量至關重要,因為這反映了實際的實體 RAM 用量,因此可以偵測到記憶體片段過多。舉例來說,如果 RSS 接近叢集的容器限制,可能會導致 OOM 問題。

redis.googleapis.com/cluster/node/memory/scripts_usage 這項指標會追蹤叢集節點上指令碼相關的記憶體負荷。這項指標會測量 EVAL 函式使用的記憶體負荷位元組數。這類記憶體會視為叢集的整體 used_memory 一部分。
redis.googleapis.com/cluster/node/memory/maxmemory_policy 這項指標會追蹤叢集節點的驅逐政策設定。 這項指標會回報節點目前的 maxmemory-policy 設定,決定 Memorystore for Redis Cluster 達到 maxmemory 限制時,如何選取要清除的鍵。
redis.googleapis.com/cluster/node/persistence/aof_enabled 這項指標會指出叢集節點是否已啟用僅限附加檔案 (AOF) 持久性。
redis.googleapis.com/cluster/node/persistence/async_loading 這項指標表示 Memorystore for Redis Cluster 是否會在提供現有資料的同時,以非同步方式載入複寫資料集。這項指標會追蹤 Memorystore for Redis Cluster 載入資料集的狀態。啟用 repl-diskless-load 設定並設為 swapdb 時,就會發生這種情況。
redis.googleapis.com/cluster/node/persistence/loading 這項指標會指出 Memorystore for Redis Cluster 是否在叢集節點上載入傾印檔案。您可以透過這項指標評估 Memorystore for Redis Cluster 是否從永久儲存空間載入資料,例如 Redis 資料庫 (RDB) 快照或 AOF 檔案。
redis.googleapis.com/cluster/node/persistence/current_cow_peak

這項指標會追蹤叢集節點上子項分叉程序期間,與寫入時複製 (COW) 作業相關聯的尖峰記憶體用量。這項指標會測量子項分叉執行時,COW 記憶體的大小上限 (以位元組為單位)。這類作業包括分叉程序,例如建立 RDB 快照或執行 AOF 重新寫入。

監控 COW 大小峰值對於容量規劃和避免 OOM 問題非常重要,因為在分叉程序期間,節點的總記憶體用量會增加,增加量等於分叉處於啟用狀態時修改的資料量。

redis.googleapis.com/cluster/node/persistence/current_cow_size

這項指標會追蹤子項分叉程序在叢集節點上處於活動狀態時,COW 記憶體的目前大小。這項指標會測量分叉程序期間複製的記憶體大小 (以位元組為單位),例如建立 RDB 快照或執行 AOF 重寫。

您可以使用這項指標,監控進行中的分支作業的即時記憶體負荷。

redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_time_sec

這項指標會追蹤叢集節點上 RDB 最近一次背景儲存 (BGSAVE) 作業的持續時間。這項指標會測量上次 RDB 儲存作業完成所需的時間 (以秒為單位)。

您可以使用這項指標監控持續性作業對效能的影響,尤其是在維護或擴充事件期間。

redis.googleapis.com/cluster/node/persistence/rdb_last_cow_size

這項指標會追蹤叢集節點最近一次執行 RDB 儲存作業時,COW 記憶體的大小。這項指標會測量在背景建立最新 RDB 快照時複製的記憶體量 (以位元組為單位)。

您可以使用這項指標,在維護或更新設定期間,偵錯完整同步處理的潛在問題,因為這項指標可深入瞭解持續性程序的記憶體負荷。

redis.googleapis.com/cluster/node/persistence/current_fork_percentage 這項指標會追蹤叢集節點上目前的分支程序進度,並指出作用中分支作業的完成百分比,例如用於 RDB 快照或 AOF 重寫的作業。
redis.googleapis.com/cluster/node/persistence/aof_rewrite_in_progress 這項指標會提供即時狀態 (1 代表 true,0 代表 false),指出 Memorystore for Redis Cluster 是否在叢集節點上執行 AOF 重寫作業。您可以根據這項指標,判斷背景 AOF 作業是否導致延遲或記憶體用量明顯增加。重寫作業可能會觸發暫時的負載尖峰。
redis.googleapis.com/cluster/node/persistence/aof_last_cow_size

這項指標會追蹤叢集節點最近一次 AOF 重寫作業期間使用的 COW 記憶體大小。這項指標會測量 Memorystore for Redis Cluster 在執行上次背景 AOF 重寫時複製的記憶體量 (以位元組為單位)。

您可以使用這項指標,在持續性作業期間監控 COW 記憶體大小。這對容量規劃至關重要,因為在分叉程序期間,節點的總記憶體用量會增加,增加量等於分叉啟動期間修改的資料量。如果您未管理 COW 記憶體,叢集可能會發生 OOM 問題。

redis.googleapis.com/cluster/node/persistence/aof_last_rewrite_time_sec 這項指標會測量叢集節點上最近一次背景 AOF 重寫作業完成所需的時間 (以秒為單位)。您可以使用這項指標評估背景 AOF 持續性對效能的影響,並瞭解重寫作業造成的暫時性負載尖峰持續時間。
redis.googleapis.com/cluster/node/errorstats/errors_count 這項指標會詳細顯示 Memorystore for Redis Cluster 內部統計資料的 ERRORSTATS 部分所衍生的錯誤。這項指標會測量一段時間內的錯誤計數變化。
redis.googleapis.com/cluster/node/stats/acl_access_denied_auths_count 這項指標會回報一段時間內,存取控制清單 (ACL) 存取遭拒的驗證失敗總次數。
redis.googleapis.com/cluster/node/stats/expire_cycle_cpu_millisecond_count 這項指標會測量一段時間內,用於有效到期週期累計的 CPU 時間。
redis.googleapis.com/cluster/node/stats/expired_keys_percentage 這項指標會顯示某個時間點的預估過期鍵百分比,可深入瞭解鍵的過期程序。如果百分比持續偏高,表示 Memorystore for Redis Cluster 可能未分配足夠的背景 CPU 週期,以跟上鍵的過期率。
redis.googleapis.com/cluster/node/stats/expired_time_cap_reached_count 這項指標會計算在一段時間間隔內,達到時間限制的週期累計次數。如果這項指標的值偏高或持續增加,通常表示過期金鑰導致記憶體用量偏高。為維護資料集健康狀態,可能需要更多背景 CPU 週期。
redis.googleapis.com/cluster/node/stats/pubsub_channels 這項指標會顯示有用戶端訂閱項目的全球 Pub/Sub 頻道數量。
redis.googleapis.com/cluster/node/stats/pubsub_patterns 這項指標會顯示有用戶端訂閱項目的 Pub/Sub 模式全域數量。
redis.googleapis.com/cluster/node/stats/pubsubshard_channels 這項指標會顯示有用戶端訂閱項目的 Pub/Sub 分片管道全球數量。
redis.googleapis.com/cluster/node/stats/total_fork_count

這項指標會測量某個時間間隔內,分叉總數的變化。這項指標是 Memorystore for Redis Cluster 背景活動的重要指標。

您可以利用這項指標監控容量規劃的分支頻率,因為每個分支程序都會用到 COW 記憶體。COW 記憶體會增加叢集節點的整體記憶體用量。

redis.googleapis.com/cluster/node/stats/tracking_total_keys 這項指標會顯示 Memorystore for Redis Cluster 追蹤的鍵數量。這項指標是伺服器端追蹤功能的其中一環,可讓用戶端維護本機快取,並在 Memorystore for Redis Cluster 上的鍵變更時失效。
redis.googleapis.com/cluster/node/stats/tracking_total_items 這項指標顯示 Memorystore for Redis Cluster 追蹤的項目總數。這項指標代表觀看各個鍵的所有用戶端總和。
redis.googleapis.com/cluster/node/stats/tracking_total_prefixes 這項指標會顯示 Memorystore for Redis Cluster 的 prefix 表格中追蹤的前置字元數。
redis.googleapis.com/cluster/node/stats/latest_fork_usec 這項指標會顯示最新分叉作業的持續時間 (以微秒為單位)。
redis.googleapis.com/cluster/node/replication/primary_sync_in_progress

這項指標會顯示主要叢集是否與副本同步。值為 1 表示同步處理正在進行中;值為 0 表示叢集未與副本同步。

您可以使用這項指標排解資料一致性問題,並瞭解擴充或維護事件的進度。

redis.googleapis.com/cluster/node/replication/sync_partial_ok_count 這項指標會計算部分重新同步嘗試成功次數。
redis.googleapis.com/cluster/node/replication/sync_partial_err_count

這項指標會測量部分重新同步嘗試失敗的次數。

您可以將這項指標做為複製健康狀態的指標。如果部分重新同步失敗,備用資源必須執行完整重新同步。這包括在主要叢集上建立 RDB 快照,並透過網路傳輸整個資料集。

redis.googleapis.com/cluster/node/replication/sync_full_count

這項指標會評估主要叢集與副本之間完整重新同步次數的變化。如果部分重新同步失敗,系統會執行完整重新同步。如果主要叢集上的複製積壓工作量不足以保存備用資源在連線中斷期間遺失的資料,就會發生這種情況。

您可以使用這項指標,診斷叢集的複寫健康狀態和容量問題。

redis.googleapis.com/cluster/node/memory/maxmemory

這項指標反映叢集節點的 maxmemory 設定,也就是 Memorystore for Redis Cluster 可耗用的最大記憶體量。這項設定會根據 maxmemory-policy 的設定,決定 Memorystore for Redis Cluster 開始逐出鍵的時間。

這項指標定義了資料儲存空間和伺服器負擔的記憶體用量上限,因此可用於容量規劃和排解 OOM 問題。

如要進一步瞭解 maxmemorymaxmemory-policy 設定,請參閱「可修改的設定參數」。

跨區域複製指標

本節列出並說明跨區域複製指標。

指標名稱 說明
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links 這項指標會顯示主要和次要叢集之間的分片連結數量。在跨區域複製群組中,主要叢集會回報與群組中次要叢集建立的 CRR 複製連結數量。對於每個次要叢集,這個數字應等於分片數。如果數量意外低於分片數量,這表示複寫器和追隨者之間的複寫作業已停止。在理想狀態下,這個指標應與主要叢集分片計數相同。
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff 這項指標會測量叢集主要和次要 (副本) 分片之間,不同區域的最大複製偏移差異 (以位元組為單位)。
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff 這項指標會測量不同區域的叢集,其主要和副本分片之間的平均複製偏移差異 (以位元組為單位)。如果指標值偏高,表示有複寫延遲問題,您可以暫停再繼續複寫來解決。

JSON 指標

本節列出 JSON 文件的節點層級指標。

節點層級指標

這些指標可提供詳細的深入分析資訊,包括 JSON 文件總數,以及這些文件耗用的記憶體量。

指標名稱 說明
redis.googleapis.com/cluster/node/json/documents_count 這項指標會評估叢集節點上的 JSON 文件總數。您可以使用這項指標追蹤資料分配和容量,因為這項指標會顯示節點層級的索引、刪除或合併文件數量。
redis.googleapis.com/cluster/node/json/used_memory 這項指標會測量 JSON 文件耗用的記憶體量 (以位元組為單位,或以可用記憶體百分比表示)。您可以使用這項指標監控容量、找出記憶體受限的節點,以及觸發調整大小動作。

持續性指標

本節列出並說明持續性指標。

RDB 持久性指標

本節列出並說明 RDB 持續性指標。

叢集層級指標

本節列出並說明叢集層級的 RDB 持續性指標。

指標名稱 說明
redis.googleapis.com/cluster/persistence/rdb_saves_count

這項指標會追蹤叢集節點上 RDB 持久性快照 (又稱為 RDB 儲存) 的累計次數。您可以使用這項指標,監控每個節點的 RDB 快照頻率和成功率。

指標含有 status_code 欄位。如要檢查 RDB 快照是否失敗,請依 3 - INTERNAL_ERROR 狀態篩選 status_code 欄位。

redis.googleapis.com/cluster/persistence/rdb_save_ages 這項指標會顯示叢集所有節點的分布快照年齡。如果是復原事件,您可以使用這項指標查看資料過時的時間範圍。理想情況下,分布的值應小於 (或等於) 快照頻率的延遲時間。

節點層級指標

指標名稱 說明
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress 這項指標表示叢集節點上是否正在執行 RDB 背景儲存作業 (BGSAVE)。TRUE 狀態表示 BGSAVE 處於啟用狀態。
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status 這項指標會指出叢集節點上的 BGSAVE 作業是否完成,或是發生錯誤。TRUE 狀態表示作業已完成。
redis.googleapis.com/cluster/node/persistence/rdb_saves_count 這項指標會追蹤叢集節點上建立的累計 RDB 快照數量。您可以使用這項指標,監控節點上快照的頻率和成功率。
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age 這項指標會測量自上次成功建立 RDB 快照以來經過的時間 (以秒為單位)。您可以使用這項指標,監控叢集節點上 RDB 持續性資料的過時程度。
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until 這項指標會測量叢集節點下次預定產生 RDB 快照前,剩餘的時間 (以秒為單位)。您可以使用這項指標監控 RDB 持久性排程,並追蹤下次自動建立快照的時間。
redis.googleapis.com/cluster/node/persistence/current_save_keys_total 這項指標會追蹤叢集節點上目前 RDB 儲存作業中處理的金鑰總數。

AOF 持久性指標

本節列出並說明 AOF 持久性指標。

叢集層級指標

本節列出並說明叢集層級的 AOF 持久性指標。

指標名稱 說明
redis.googleapis.com/cluster/persistence/aof_fsync_lags

這項指標會測量叢集中所有節點的時間差 (或延遲),這些節點會將資料寫入 AOF,並在資料成功同步至耐久儲存空間時通過。

如果 appendfsync 參數設為 everysec,您可以使用這項指標評估叢集的持續性健康狀態。理想情況下,延遲時間的分布應小於 (或等於) AOF 的同步頻率。

redis.googleapis.com/cluster/persistence/aof_rewrite_count

這項指標會追蹤叢集節點觸發 AOF 重寫作業的累計次數。您可以根據這項指標診斷效能問題,因為 AOF 重寫頻率過高可能會導致叢集出現延遲尖峰或記憶體壓力。

這項指標含有 status_code 欄位。如要檢查 AOF 重新編寫是否失敗,請依 3 - INTERNAL_ERROR 狀態篩選這個欄位。

節點層級指標

本節列出並說明節點層級的 AOF 持久性指標。

指標名稱 說明
redis.googleapis.com/cluster/node/persistence/aof_last_write_status 這項指標會顯示叢集節點上,上次寫入 AOF 檔案的作業狀態。如果狀態為 TRUE,表示寫入作業成功。您可以使用這項指標,確認 Memorystore for Redis Cluster 是否成功保存資料。
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status 這項指標會顯示叢集節點上次執行 AOF bgrewrite 作業的狀態。如果狀態為 TRUE,表示作業成功。
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

這項指標會測量叢集節點的時間差 (或延遲),也就是從資料寫入 AOF 到資料成功同步至耐久儲存空間之間的時間。

如果 appendfsync 參數設為 everysec,您可以使用指標評估節點的持續性健康狀態。如果資料同步處理時間超過 1 秒,表示持續性落後於傳入資料,可能導致效能下降,或在當機情況下發生資料遺失。

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

這項指標會追蹤叢集節點觸發 AOF 重寫作業的累計次數。您可以運用這項指標診斷效能問題。如果 AOF 重寫頻率過高,可能會導致叢集延遲增加或記憶體壓力。

這項指標含有 status_code 欄位。如要檢查 AOF 重新編寫是否失敗,請依 3 - INTERNAL_ERROR 狀態篩選這個欄位。

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count 這項指標會追蹤叢集節點上 AOF fsync() 系統呼叫失敗的累計次數。這項指標僅適用於已啟用 AOF 的叢集,且 appendfsync 參數設為 everysecalways

常見的持續性指標

本節列出並說明適用於 AOF 和 RDB 持續性的指標。

節點層級指標

本節列出並說明節點層級的 AOF 和 RDB 持續性指標。

指標名稱 說明
redis.googleapis.com/cluster/node/persistence/auto_restore_count

這項指標會追蹤叢集節點從持續性傾印檔案 (AOF 或 RDB) 自動還原的累計次數。

指標含有 status_code 欄位。如要檢查還原作業是否失敗,請依 3 - INTERNAL_ERROR 狀態篩選這個欄位。

持續性指標的應用實例

本節說明 AOF 和 RDB 持續性指標的範例用途。

檢查 AOF 寫入作業是否導致延遲和記憶體壓力

假設您發現叢集或叢集內的節點延遲時間或記憶體用量增加,請檢查額外用量是否與 AOF 持久性有關。

AOF 重寫作業可能會觸發暫時的負載尖峰。建議您檢查 aof_rewrites_count 指標,因為這項指標會提供叢集或叢集節點生命週期內的 AOF 重寫累計次數。

假設這項指標顯示,重寫次數的增量與延遲時間的增量相符。如要減少重寫頻率,請降低寫入速率或增加分片數。

檢查 RDB 儲存作業是否導致延遲和記憶體壓力

假設您發現叢集或叢集內的節點延遲時間或記憶體用量增加,如果發生這種情況,請檢查額外用量是否與 RDB 持續性有關。

RDB 儲存作業可能會觸發暫時性的負載尖峰。建議您檢查 rdb_saves_count 指標,因為這項指標會提供叢集或叢集節點生命週期內 RDB 儲存作業的累計次數。

假設這項指標顯示 RDB 儲存次數的增量與延遲時間的增量相符,如要降低 RDB 儲存頻率,請增加 RDB 快照間隔。此外,如要降低基準負載量,請擴大叢集。

解讀 Memorystore for Redis Cluster 的指標

許多指標都屬於下列類別:平均值、最大值和總值。

我們提供相同指標的「平均」和「最大」變數,方便您使用這兩項指標找出該指標系列的熱點。

指標的總計值與指標的平均最大變異無關。這個值提供的洞察資料與熱點變體的用途無關。

瞭解平均和最高指標

假設您要比較叢集的 average_keyspace_hitsmaximum_keyspace_hits 指標值。這兩項指標的差異越大,表示叢集中熱點的命中次數越多。如果指標值接近,表示命中次數在叢集節點間的分布較平均。

這項原則適用於所有指標,包括相同指標的平均最高變體。

互動區範例

比較叢集中所有分片的 average_keyspace_hitsmaximum_keyspace_hits 指標值,即可判斷哪些分片發生熱點。舉例來說,假設六個分片的叢集中的分片有以下點擊次數:

  • 資料分割 1 - 2 命中
  • 分片 2 - 2 次命中
  • 分片 3 - 2 次命中
  • 分片 4 - 2 次命中
  • 分片 5 - 2 次命中
  • 第 6 到 8 個分片

在本例中,average_keyspace_hits 指標會傳回值 3,但 maximum_keyspace_hits 指標會傳回值 8。命中次數並未平均分配到叢集中的分片。分片 6 是資源使用率不均的節點,因為該分片處理的流量比例過高。