支援的監控指標

本頁面列出 Memorystore for Redis Cluster 適用的指標,並說明各項指標的用途。

備份指標

本節列出並說明「備份」和「匯入」指標。

叢集層級指標

本節列出並說明叢集層級的備份和匯入指標。

指標名稱 說明
redis.googleapis.com/cluster/backup/last_backup_start_time 這項指標會顯示上次備份作業的開始時間。
redis.googleapis.com/cluster/backup/last_backup_status 這項指標會顯示最近一次備份嘗試是否成功。狀態分別是 1 (適用於 Success) 和 0 (適用於 Failed)。
redis.googleapis.com/cluster/backup/last_backup_duration 這項指標會顯示上次備份作業的時間長度 (以毫秒為單位)。
redis.googleapis.com/cluster/backup/last_backup_size 這項指標會顯示上次備份的大小 (以位元組為單位)。這項指標是監控備份效率和儲存空間容量規劃的重要指標。
redis.googleapis.com/cluster/import/last_import_start_time 這項指標會顯示上次匯入作業的開始時間。
redis.googleapis.com/cluster/import/last_import_duration 這項指標會顯示上次匯入作業的時間長度 (以毫秒為單位)。

憑證授權單位 (CA) 指標

本節列出與客戶管理的憑證授權單位 (CA) 相關的指標。

叢集層級指標

這些指標提供與叢集中機器相關聯的憑證高階總覽。

指標名稱 說明
redis.googleapis.com/cluster/security/rotate_tls_cert_count

這項指標會顯示與叢集中機器相關聯的輪替憑證狀態。

指標可能處於下列狀態:

  • SUCCESS:Memorystore for Redis Cluster 已輪替憑證。
  • FAILED:Memorystore for Redis Cluster 未輪替憑證,因為憑證無法使用、Memorystore for Redis Cluster 沒有輪替憑證的權限,或發生內部錯誤。
  • SKIPPED:Memorystore for Redis Cluster 已略過憑證輪替作業,因為不需要輪替憑證。

Cloud Monitoring 指標

本節列出並說明適用於 Memorystore for Redis Cluster 的 Cloud Monitoring 指標。

叢集層級指標

這些指標可提供叢集整體健康狀態和效能的概要總覽。您可以運用這些指標瞭解叢集的整體容量和使用率,並找出潛在瓶頸或可改善之處。

指標名稱 說明
redis.googleapis.com/cluster/clients/average_connected_clients 這項指標會測量指定時間內,叢集的平均有效用戶端連線數。您可以使用這項指標監控連線資源調度情形、找出應用程式瓶頸,並確保叢集穩定運作。
redis.googleapis.com/cluster/clients/maximum_connected_clients 這項指標會顯示叢集所有節點的有效用戶端連線數上限。您可以使用這項指標,隨時監控叢集上的最高連線負載。這對確保叢集的高效能至關重要,因為連線數過高可能會增加回應時間。
redis.googleapis.com/cluster/clients/total_connected_clients 這項指標會追蹤叢集目前有效的用戶端連線數量。您可以使用這項指標監控資料庫的負載,並避免連線限制。
redis.googleapis.com/cluster/stats/total_connections_received_count 這項指標會顯示叢集中在過去一分鐘內建立的用戶端連線累計數量。您可以使用這項指標分析流量負載、確保未超過連線限制,並判斷是否需要擴充叢集。
redis.googleapis.com/cluster/stats/total_rejected_connections_count 這項指標會追蹤因達到 maxclients 限制而遭拒的叢集連線總數。
redis.googleapis.com/cluster/commandstats/total_usec_count 這項指標會測量每個指令耗用的 CPU 總時間。這項指標代表使用的總微秒數,可深入瞭解叢集的效能和延遲時間。
redis.googleapis.com/cluster/commandstats/total_calls_count 這項指標會評估與叢集節點上特定指令相關聯的呼叫總數 (以分鐘為單位)。如要找出特定指令的瓶頸或高流量,可以使用指標監控主要和副本節點的指令輸送量 (每分鐘的指令數)。
redis.googleapis.com/cluster/cpu/average_utilization 這項指標會顯示叢集的平均 CPU 使用率 (介於 0.0 到 1.0 之間)。您可以根據這項指標找出資源佈建過度或使用率不足的情況、管理自動調整資源配置的閾值,以及偵測效能瓶頸,理想的使用率為 40% 至 70%。
redis.googleapis.com/cluster/cpu/maximum_utilization

這項指標會顯示叢集中所有節點的 CPU 尖峰使用率 (從 0.0 到 1.0)。

這項指標只會匯總 sys_main_threaduser_main_thread 狀態。不包括 /cluster/node/cpu/utilization 指標提供的其他 CPU 狀態 (例如 sys_childrenuser_children)。

請確認主要節點的 CPU 使用率不超過 0.8 秒,且每個指定為讀取副本的副本不超過 0.5 秒。詳情請參閱「CPU 使用率最佳做法」。

redis.googleapis.com/cluster/stats/average_expired_keys 這項指標會評估叢集所有主要節點的平均金鑰到期事件數。您可以使用這項指標監控即將過期的金鑰數量。
redis.googleapis.com/cluster/stats/maximum_expired_keys 這項指標會測量叢集所有主要節點中,發生金鑰到期事件的次數上限。
redis.googleapis.com/cluster/stats/total_expired_keys_count 這項指標會追蹤叢集所有主要節點中發生的重要到期事件總數。您可以利用 指標監控即將過期的金鑰數量。
redis.googleapis.com/cluster/stats/average_evicted_keys 這項指標會追蹤叢集主要分片因記憶體容量限制而遭逐出的平均鍵數。
redis.googleapis.com/cluster/stats/maximum_evicted_keys 這個指標顯示因記憶體容量不足,而從主要叢集的節點或分片中逐出的鍵數量上限。
redis.googleapis.com/cluster/stats/total_evicted_keys_count 這項指標顯示 主要叢集節點因記憶體容量而剔除的鍵總數。
redis.googleapis.com/cluster/keyspace/total_keys 這項指標會顯示叢集中儲存的鍵數量。
redis.googleapis.com/cluster/stats/average_keyspace_hits 這項指標顯示叢集中所有節點的平均金鑰查閱成功次數。
redis.googleapis.com/cluster/stats/maximum_keyspace_hits 這項指標會顯示叢集節點中成功查閱鍵的次數上限。您可以使用這項指標監控叢集的效能,並找出叢集中的潛在熱點。
redis.googleapis.com/cluster/stats/total_keyspace_hits_count 這項指標會追蹤叢集中所有節點的成功鍵查閱累計次數。
redis.googleapis.com/cluster/stats/average_keyspace_misses 這項指標會顯示叢集中鍵的平均查閱失敗次數。您可以使用這項指標,追蹤系統要求金鑰但未在快取中找到金鑰的頻率。
redis.googleapis.com/cluster/stats/maximum_keyspace_misses 這項指標顯示叢集節點中,金鑰查閱失敗次數的上限。
redis.googleapis.com/cluster/stats/total_keyspace_misses_count 這項指標顯示所有叢集節點中,鍵查閱失敗的總次數。
redis.googleapis.com/cluster/memory/average_utilization 這項指標會顯示叢集的平均記憶體使用率 (從 0.0 到 1.0)。您可以使用這項指標監控叢集容量,並設定快訊閾值。舉例來說,您可以設定快訊門檻,在平均記憶體用量超過特定百分比 (例如 80%) 時通知使用者。
redis.googleapis.com/cluster/memory/maximum_utilization 這項指標顯示所有叢集節點的最高記憶體使用率 (從 0.0 到 1.0)。您可以使用這項指標,判斷何時該調度叢集資源。建議您監控使用情況,確保使用率維持在 100% 以下。在高寫入負載下,如果這項指標達到 65% 至 85%,效能可能會降低。
redis.googleapis.com/cluster/memory/total_used_memory 這項指標會顯示叢集的記憶體用量總計 (以位元組為單位)。您可以使用這項指標監控叢集的容量。
redis.googleapis.com/cluster/memory/size 這項指標會測量叢集中所有節點的 RAM 總量、已用量和可用量。您可以使用這項指標監控叢集容量,並避免節點故障。
redis.googleapis.com/cluster/replication/average_ack_lag 這項指標會顯示叢集中副本的平均確認延遲時間 (以秒為單位)。

確認延遲是叢集主要節點的瓶頸。這是因為備用節點無法跟上主要節點傳送的資訊,發生這種情況時,主要節點必須等待副本確認收到資訊。這可能會導致交易提交速度變慢,並對主要節點的效能造成影響。
redis.googleapis.com/cluster/replication/maximum_ack_lag 這項指標會顯示叢集中副本的最大確認延遲時間 (以秒為單位)。
redis.googleapis.com/cluster/replication/average_offset_diff 這項指標顯示整個叢集的平均複製確認位移差異 (以位元組為單位)。

「複製確認偏移差異」是指備用資源與主要叢集之間未複製的位元組數。
redis.googleapis.com/cluster/replication/maximum_offset_diff 這項指標顯示叢集內的最大複製偏移差異 (以位元組為單位)。

複製偏移差異是指副本及其主要叢集之間未複製的位元組數。
redis.googleapis.com/cluster/stats/total_net_input_bytes_count 這項指標會顯示叢集端點收到的傳入網路位元組數。
redis.googleapis.com/cluster/stats/total_net_output_bytes_count 這項指標會顯示叢集端點傳送的輸出網路位元組數。

節點層級指標

這些指標可提供叢集中個別節點的健康狀態和效能深入分析。您可以利用這些指標排解節點問題,進一步提升節點效能。

指標名稱 說明
redis.googleapis.com/cluster/node/clients/connected_clients 這項指標表示叢集節點的有效用戶端連線數量,不包括副本連線。您可以使用這項指標監控連線限制,並找出分片接收不成比例流量的熱點。
redis.googleapis.com/cluster/node/clients/blocked_clients 這項指標會顯示叢集節點封鎖的用戶端連線數。如果遭到封鎖的用戶端連線數量偏高或快速增加,可能表示許多用戶端都在等待作業。這可能會導致延遲時間增加。
redis.googleapis.com/cluster/node/server/uptime 這項指標會測量叢集節點的正常運作時間。您可以使用這項指標,追蹤伺服器持續運作的時間長度,期間不會重新啟動或發生故障。
redis.googleapis.com/cluster/node/stats/connections_received_count 這項指標會追蹤指定時間內,在叢集節點上建立的用戶端連線總數。您可以使用指標監控叢集內個別節點的連線流量。因此,您可以分析負載分配情形,並找出連線活動的尖峰。
redis.googleapis.com/cluster/node/stats/rejected_connections_count 這項指標顯示因叢集節點達到 maxclients 限制而遭拒的連線數。您可以透過這項指標判斷節點是否承受高連線壓力,並因無法處理更多連線而拒絕建立新連線。
redis.googleapis.com/cluster/node/commandstats/usec_count 這項指標會顯示每個指令在叢集節點中耗用的總時間。您可以使用這項指標分析指令的效能、找出速度緩慢的指令,以及排解節點層級的延遲問題。
redis.googleapis.com/cluster/node/commandstats/calls_count 這項指標會追蹤叢集節點上每分鐘的指令呼叫總數。您可以使用這項指標監控流量分配情形、找出使用量大的指令,以及排解個別節點的瓶頸問題。
redis.googleapis.com/cluster/node/cpu/utilization 這項指標會顯示叢集節點的 CPU 使用率 (從 0.0 到 1.0)。
redis.googleapis.com/cluster/node/stats/expired_keys_count 這項指標會顯示叢集節點中的過期事件總數。您可以使用這項指標,監控金鑰從叢集中移除的速率,因為金鑰的存留時間 (TTL) 達到零。
redis.googleapis.com/cluster/node/stats/evicted_keys_count 這項指標會計算叢集節點因達到記憶體上限而逐出的鍵總數。這項指標可判斷叢集是否承受記憶體壓力。如果遭到逐出的鍵數量偏高或持續增加,表示叢集空間即將用盡。因此,叢集會移除金鑰,以便容納新資料。
redis.googleapis.com/cluster/node/keyspace/total_keys 這項指標會測量叢集節點儲存的索引鍵總數。這項指標可顯示節點間的資料分布和分片情形。
redis.googleapis.com/cluster/node/stats/keyspace_hits_count 這項指標會追蹤叢集節點上成功的重要查閱次數。您可以使用這項指標,監控節點擷取記憶體內資料的效率。
redis.googleapis.com/cluster/node/stats/keyspace_misses_count 這項指標會追蹤叢集節點上失敗的鍵值查閱次數。
redis.googleapis.com/cluster/node/memory/utilization 這項指標會追蹤叢集節點的記憶體使用率 (從 0.0 到 1.0)。您可以運用這項指標避免節點故障,確保叢集穩定運作。
redis.googleapis.com/cluster/node/memory/usage 這項指標可衡量叢集節點的記憶體用量總計。
redis.googleapis.com/cluster/node/stats/net_input_bytes_count 這項指標會測量叢集節點接收的網路位元組總數。您可以使用這項指標監控網路總處理量、找出潛在瓶頸,以及分析節點上的流量尖峰。
redis.googleapis.com/cluster/node/stats/net_output_bytes_count 這項指標會測量叢集節點傳送的外送網路位元組總數。您可以利用這項指標監控節點的網路輸出量,以利進行效能調整和容量規劃。
redis.googleapis.com/cluster/node/replication/offset 這項指標會測量叢集節點的複製偏移位元組。將叢集的備用資源升級為主要叢集前,您可以使用這項指標檢查備用資源是否已處理所有資料。這樣做可避免資料遺失。
redis.googleapis.com/cluster/node/server/healthy 這項指標會判斷叢集節點是否可用且運作正常。

跨區域複製指標

本節列出並說明跨區域複製指標。

指標名稱 說明
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links 這項指標會顯示主要和次要叢集之間的分片連結數量。在跨區域複製群組中,主要叢集會回報與群組中次要叢集建立的 CRR 複製連結數量。對於每個次要叢集,這個數字應等於分片數。如果數量意外低於分片數量,這表示複寫器和追隨者之間的複寫作業已停止,在理想狀態下,這個指標應與主要叢集分片計數相同。
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff 這項指標會測量叢集主要和次要 (副本) 分片之間,不同區域的最大複製偏移差異 (以位元組為單位)。
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff 這項指標會測量不同區域的叢集,其主要和副本分片之間的平均複製偏移差異 (以位元組為單位)。如果指標值偏高,表示有複寫延遲問題,您可以暫停並繼續複寫來解決。

JSON 指標

本節列出 JSON 文件的節點層級指標。

節點層級指標

這些指標可提供詳細的深入分析資訊,包括 JSON 文件總數,以及這些文件耗用的記憶體量。

指標名稱 說明
redis.googleapis.com/cluster/node/json/documents_count 這項指標會評估叢集節點上的 JSON 文件總數。您可以使用這項指標追蹤資料分配和容量,因為這項指標會顯示節點層級的索引、刪除或合併文件數量。
redis.googleapis.com/cluster/node/json/used_memory 這項指標會測量 JSON 文件消耗的記憶體量 (以位元組為單位,或以可用記憶體百分比表示)。您可以使用這項指標監控容量、找出記憶體繫結節點,以及觸發資源調度動作。

持續性指標

本節列出並說明持續性指標。

RDB 持久性指標

本節列出並說明 Redis 資料庫 (RDB) 持續性指標。

叢集層級指標

本節列出並說明叢集層級的 RDB 持續性指標。

指標名稱 說明
redis.googleapis.com/cluster/persistence/rdb_saves_count

這項指標會追蹤叢集節點上 RDB 持續性快照 (也稱為 RDB 儲存) 的累計次數。您可以使用這項指標,監控每個節點的 RDB 快照頻率和成功率。

指標具有 status_code 欄位。如要檢查 RDB 快照是否失敗,請依 status_code 欄位篩選 3 - INTERNAL_ERROR 狀態。

redis.googleapis.com/cluster/persistence/rdb_save_ages 這項指標會顯示叢集所有節點的分布快照年齡。如果是復原事件,您可以使用這項指標查看資料過時的時間範圍。理想情況下,分布的值應小於 (或等於) 快照頻率的延遲時間。

節點層級指標

指標名稱 說明
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress 這項指標會指出叢集節點上是否正在執行 RDB 背景儲存作業 (BGSAVE)。TRUE 狀態表示 BGSAVE 處於啟用狀態。
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status 這項指標會指出叢集節點上的 BGSAVE 作業是否完成,或是發生錯誤。TRUE 狀態表示作業已完成。
redis.googleapis.com/cluster/node/persistence/rdb_saves_count 這項指標會追蹤叢集節點上建立的累計 RDB 快照數量。您可以使用這項指標監控節點上快照的頻率和成功率。
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age 這個指標會測量自上次成功建立 RDB 快照以來經過的時間 (以秒為單位)。您可以使用這項指標,監控叢集節點上 RDB 持續性資料的過時程度。
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until 這項指標會測量叢集節點下次預定產生 RDB 快照前,剩餘的時間 (以秒為單位)。您可以使用這項指標監控 RDB 持久性排程,並追蹤下一次自動快照的建立時間。
redis.googleapis.com/cluster/node/persistence/current_save_keys_total 這項指標會追蹤叢集節點上目前 RDB 儲存作業處理的金鑰總數。

AOF 持久性指標

本節列出並說明僅限附加檔案 (AOF) 持續性指標。

叢集層級指標

本節列出並說明叢集層級的 AOF 持久性指標。

指標名稱 說明
redis.googleapis.com/cluster/persistence/aof_fsync_lags

這項指標會測量叢集中所有節點的時間差 (或延遲),這些節點會通過將資料寫入 AOF 的程序,以及將資料成功同步至耐久儲存空間的程序。

如果 appendfsync 參數設為 everysec,您可以使用這項指標評估叢集的持續性健康狀態。理想情況下,延遲時間的分佈值應小於或等於 AOF 的同步頻率。

redis.googleapis.com/cluster/persistence/aof_rewrite_count

這項指標會追蹤叢集節點觸發 AOF 重寫作業的累計次數。您可以使用這項指標診斷效能問題,因為 AOF 重寫頻率過高可能會導致叢集延遲尖峰或記憶體壓力。

指標具有 status_code 欄位。如要檢查 AOF 重新編寫是否失敗,請依 3 - INTERNAL_ERROR 狀態篩選這個欄位。

節點層級指標

本節列出並說明節點層級的 AOF 持久性指標。

指標名稱 說明
redis.googleapis.com/cluster/node/persistence/aof_last_write_status 這項指標會顯示叢集節點上 AOF 檔案的上次寫入作業狀態。如果狀態為 TRUE,表示寫入作業成功。您可以使用這項指標,確認 Memorystore for Redis Cluster 是否成功保存資料。
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status 這項指標會顯示叢集節點上次執行 AOF bgrewrite 作業的狀態。如果狀態為 TRUE,表示作業成功。
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

這項指標會測量叢集節點的時間差 (或延遲),也就是從資料寫入 AOF 到資料成功同步至耐久儲存空間之間的時間。

如果 appendfsync 參數設為 everysec,您可以使用指標評估節點的持續性健康狀態。如果資料同步處理時間超過 1 秒,表示持久性作業落後於傳入資料,這可能會導致效能降低,或在當機情況下遺失資料。

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

這項指標會追蹤叢集節點觸發 AOF 重寫作業的累計次數。您可以使用指標診斷效能問題。如果 AOF 重寫頻率過高,可能會導致叢集延遲增加或記憶體壓力。

指標具有 status_code 欄位。如要檢查 AOF 重新編寫是否失敗,請依 3 - INTERNAL_ERROR 狀態篩選這個欄位。

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count 這項指標會追蹤叢集節點上 AOF fsync() 系統呼叫失敗的累計次數。這項指標僅適用於啟用 AOF 的叢集,且 appendfsync 參數設為 everysecalways

常見的持續性指標

適用於 AOF 和 RDB 持續性機制的指標。

節點層級指標

指標名稱 說明
redis.googleapis.com/cluster/node/persistence/auto_restore_count 這項指標會顯示從傾印檔案 (AOF 或 RDB) 還原的次數。

持續性指標的應用實例

檢查 AOF 寫入作業是否導致延遲和記憶體壓力

假設您發現叢集或叢集內的節點延遲時間增加或記憶體用量提高,在這種情況下,您可能需要檢查額外用量是否與 AOF 持久性有關。

由於您知道 AOF 重寫作業可能會觸發暫時性負載尖峰,因此可以檢查 aof_rewrites_count 指標,瞭解叢集生命週期或叢集內節點的 AOF 重寫累計次數。假設這項指標顯示,重寫次數增加會導致延遲時間變長,在這種情況下,您可以降低寫入速率或增加分片數,以減少重寫頻率,解決這個問題。

檢查 RDB 儲存作業是否導致延遲和記憶體壓力

假設您發現叢集或叢集內的節點延遲時間增加或記憶體用量提高,在這種情況下,您可能需要檢查額外用量是否與 RDB 持續性有關。

由於您知道 RDB 儲存作業可能會觸發暫時的負載尖峰,因此可以檢查 rdb_saves_count 指標,該指標會提供叢集生命週期內或叢集節點內的 RDB 儲存累計次數。假設這項指標顯示 RDB 儲存次數的增量與延遲時間增加有關。在這種情況下,您可以縮短 RDB 快照間隔,降低重寫頻率。您也可以水平擴展叢集,降低基準負載量。

解讀 Memorystore for Redis Cluster 的指標

如上表所示,許多指標共用三個類別:平均值、最大值和總計。

針對 Memorystore for Redis Cluster,我們提供相同指標的「平均」和「最大」變體,因此您可以使用這兩項指標,找出該指標系列的熱點。

指標的總計值是獨立的,可提供與熱點平均最大變數目的無關的個別洞察資料。

瞭解平均和最高指標

假設您要比較叢集的 average_keyspace_hitsmaximum_keyspace_hits 值。這兩項指標的差異越大,表示叢集中有更多熱點。如果 average_keyspace_hitsmaximum_keyspace_hits 的值相近,表示命中次數在叢集中的分布較為平均。

這項原則適用於所有具有相同指標平均最大變化的指標。

互動區範例

如果比較叢集中所有分片的 average_keyspace_hitsmaximum_keyspace_hits,比較這些值會指出熱點發生位置。舉例來說,假設 6 分片叢集中的分片有以下點擊次數:

  • 資料分割 1 - 2 命中
  • 分片 2 - 2 次命中
  • Shard 3 - 2 hits
  • 分片 4 - 2 次命中
  • Shard 5 - 2 hits
  • 第 6 到 8 個分片

在本例中,average_keyspace_hits 會傳回值 3,而 maximum_keyspace_hits 會傳回 8,表示分片 6 是熱門分片。

我們提供節點層級的指標,可用於找出叢集中的熱點。