サポート対象のモニタリング指標

このページでは、Memorystore for Redis Cluster で使用可能な指標を一覧表示するとともに、各指標の測定値について説明します。

バックアップ指標

このセクションでは、バックアップインポートの指標について説明します。

クラスタレベルの指標

このセクションでは、クラスタレベルのバックアップとインポートの指標の一覧と説明を示します。

指標名 説明
redis.googleapis.com/cluster/backup/last_backup_start_time この指標は、前回のバックアップ オペレーションの開始時間を示します。
redis.googleapis.com/cluster/backup/last_backup_status この指標は、直近のバックアップ試行が正常に完了したか失敗したかを示します。ステータスは、Success の場合は 1Failed の場合は 0 です。
redis.googleapis.com/cluster/backup/last_backup_duration この指標は、前回のバックアップ オペレーションの期間(ミリ秒単位)を示します。
redis.googleapis.com/cluster/backup/last_backup_size この指標は、前回のバックアップのサイズ(バイト単位)を示します。この指標は、バックアップの効率とストレージ容量の計画をモニタリングするための重要な指標です。
redis.googleapis.com/cluster/import/last_import_start_time この指標は、前回のインポート オペレーションの開始時間を示します。
redis.googleapis.com/cluster/import/last_import_duration この指標は、前回のインポート オペレーションの期間(ミリ秒単位)を示します。

認証局(CA)の指標

このセクションでは、お客様が管理する認証局(CA)に関連付けられている指標を一覧表示します。

クラスタレベルの指標

これらの指標は、クラスタ内のマシンに関連付けられている証明書の概要を示します。

指標名 説明
redis.googleapis.com/cluster/security/rotate_tls_cert_count

この指標は、クラスタ内のマシンに関連付けられている証明書のローテーションのステータスを示します。

指標のステータスは次のいずれかになります。

  • SUCCESS: Memorystore for Redis Cluster が証明書をローテーションしました。
  • FAILED: 証明書が使用できない、Memorystore for Redis Cluster に証明書をローテーションする権限がない、または内部エラーが発生したため、Memorystore for Redis Cluster は証明書をローテーションしませんでした。
  • SKIPPED: 証明書をローテーションする必要がないため、Memorystore for Redis Cluster は証明書のローテーションをスキップしました。

Cloud Monitoring の指標

このセクションでは、Memorystore for Redis Cluster で使用可能な Cloud Monitoring 指標を一覧表示して説明します。

クラスタレベルの指標

これらの指標は、クラスタの全体的な健全性とパフォーマンスの概要を示します。これらの指標を使用すると、クラスタの全体的な容量と使用率を把握し、潜在的なボトルネックや改善すべき領域を特定できます。

指標名 説明
redis.googleapis.com/cluster/clients/average_connected_clients この指標は、指定した期間のクラスタに対するアクティブなクライアント接続の平均数を測定します。この指標を使用すると、接続のスケーリングをモニタリングし、アプリケーションのボトルネックを特定して、クラスタの安定性を確保できます。
redis.googleapis.com/cluster/clients/maximum_connected_clients この指標は、クラスタのすべてのノードでアクティブなクライアント接続の最大数を示します。この指標を使用すると、クラスタの接続負荷の最大値をいつでもモニタリングできます。接続数が多いとレスポンス時間が長くなる可能性があるため、クラスタのパフォーマンスを高く維持するには、この設定が重要です。
redis.googleapis.com/cluster/clients/total_connected_clients この指標は、クラスタへのアクティブなクライアント接続の現在の数をトラッキングします。この指標を使用して、データベースの負荷をモニタリングし、接続上限を回避できます。
redis.googleapis.com/cluster/stats/total_connections_received_count この指標は、クラスタで過去 1 分間に作成されたクライアント接続の累積数を示します。この指標を使用すると、トラフィック負荷を分析し、接続上限を超えていないことを確認して、クラスタをスケーリングする必要があるかどうかを判断できます。
redis.googleapis.com/cluster/stats/total_rejected_connections_count この指標は、maxclients の上限に達したために拒否されたクラスタへの接続の合計数を追跡します。
redis.googleapis.com/cluster/commandstats/total_usec_count この指標は、各コマンドが消費する CPU 時間の合計を測定します。この指標は、使用された合計マイクロ秒数を示します。これにより、クラスタのパフォーマンスとレイテンシに関する分析情報を得ることができます。
redis.googleapis.com/cluster/commandstats/total_calls_count この指標は、クラスタノードで特定のコマンドに関連付けられている呼び出しの合計数を 1 分間に測定します。特定のコマンドのボトルネックやトラフィックの増加を特定するには、この指標を使用して、プライマリ ノードとレプリカノード間のコマンド スループット(1 分あたりのコマンド数)をモニタリングします。
redis.googleapis.com/cluster/cpu/average_utilization この指標は、クラスタの平均 CPU 使用率(0.0 ~ 1.0)を示します。この指標を使用すると、オーバー プロビジョニングまたは使用率の低いリソースを特定し、自動スケーリングのしきい値を管理し、パフォーマンスのボトルネックを検出できます。理想的な使用率は 40 ~ 70% です。
redis.googleapis.com/cluster/cpu/maximum_utilization

この指標は、クラスタ内のすべてのノードのピーク CPU 使用率(0.0 ~ 1.0)を示します。

この指標は、sys_main_thread 状態と user_main_thread 状態のみを要約します。/cluster/node/cpu/utilization 指標で使用可能な他の CPU 状態(sys_childrenuser_children など)は含まれません。

CPU 使用率がプライマリ ノードで 0.8 秒、リードレプリカとして指定された各レプリカで 0.5 秒を超えないようにします。詳細については、CPU 使用率のベスト プラクティスをご覧ください。

redis.googleapis.com/cluster/stats/average_expired_keys この指標は、クラスタのすべてのプライマリ ノードのキーの有効期限切れイベントの平均数を測定します。この指標を使用して、有効期限が切れるキーの数をモニタリングできます。
redis.googleapis.com/cluster/stats/maximum_expired_keys この指標は、クラスタのすべてのプライマリ ノードで発生しているキーの有効期限切れイベントの最大数を測定します。
redis.googleapis.com/cluster/stats/total_expired_keys_count この指標は、クラスタのすべてのプライマリ ノードで発生しているキーの有効期限切れイベントの合計数を追跡します。この指標を使用して、有効期限が切れるキーの数をモニタリングできます。
redis.googleapis.com/cluster/stats/average_evicted_keys この指標は、クラスタのプライマリ シャード全体でメモリ容量の制約が原因で強制排除されたキーの平均数を追跡します。
redis.googleapis.com/cluster/stats/maximum_evicted_keys この指標は、メモリ容量が原因でプライマリ クラスタのノードまたはシャードから強制排除されたキーの最大数を示します。
redis.googleapis.com/cluster/stats/total_evicted_keys_count この指標は、メモリ容量が原因でプライマリ クラスタのノードによって強制排除されたキーの合計数を示します。
redis.googleapis.com/cluster/keyspace/total_keys この指標は、クラスタに保存されているキーの数を示します。
redis.googleapis.com/cluster/stats/average_keyspace_hits この指標は、クラスタ内のすべてのノードでのキーの正常な検索の平均数を示します。
redis.googleapis.com/cluster/stats/maximum_keyspace_hits この指標は、クラスタノードでのキーの正常な検索の最大数を示します。この指標を使用すると、クラスタのパフォーマンスをモニタリングし、クラスタ内の潜在的なホットスポットを特定できます。
redis.googleapis.com/cluster/stats/total_keyspace_hits_count この指標は、クラスタ内のすべてのノードでのキーの正常な検索の累積数を追跡します。
redis.googleapis.com/cluster/stats/average_keyspace_misses この指標は、クラスタ全体でのキーのルックアップに失敗した平均数を示します。この指標を使用すると、キーがリクエストされたもののキャッシュで見つからなかった頻度を追跡できます。
redis.googleapis.com/cluster/stats/maximum_keyspace_misses この指標は、クラスタノード全体でのキーの検索に失敗した最大数を示します。
redis.googleapis.com/cluster/stats/total_keyspace_misses_count この指標は、すべてのクラスタノードでキーのルックアップに失敗した合計数を示します。
redis.googleapis.com/cluster/memory/average_utilization この指標は、クラスタ全体の平均メモリ使用率(0.0 ~ 1.0)を示します。この指標を使用して、クラスタの容量をモニタリングし、アラートのしきい値を設定できます。たとえば、平均メモリが特定の割合(80% など)を超えたときにユーザーに通知するように、アラートのしきい値を設定できます。
redis.googleapis.com/cluster/memory/maximum_utilization この指標は、すべてのクラスタノードの最大メモリ使用率(0.0 ~ 1.0)を示します。この指標を使用して、クラスタをスケーリングするタイミングを特定できます。使用率が 100% を超えないように、使用状況をモニタリングすることをおすすめします。書き込み負荷が高い場合、この指標が 65% ~ 85% に達すると、パフォーマンスが低下する可能性があります。
redis.googleapis.com/cluster/memory/total_used_memory この指標は、クラスタの合計メモリ使用量(バイト単位)を示します。この指標を使用して、クラスタの容量をモニタリングできます。
redis.googleapis.com/cluster/memory/size この指標は、クラスタ内のすべてのノードの合計 RAM、使用済み RAM、使用可能な RAM を測定します。この指標を使用して、クラスタの容量をモニタリングし、ノード障害を防止できます。
redis.googleapis.com/cluster/replication/average_ack_lag この指標は、クラスタ全体におけるレプリカの平均確認応答ラグ(秒単位)を示します。

確認応答の遅延は、クラスタ内のプライマリ ノードのボトルネックです。このボトルネックは、プライマリ ノードから送信される情報にレプリカが追いつけないことが原因で発生します。この場合、プライマリ ノードは、レプリカが情報を受信したという確認応答を待つ必要があります。これにより、トランザクションの commit が遅くなり、プライマリ ノードのパフォーマンスが低下する可能性があります。
redis.googleapis.com/cluster/replication/maximum_ack_lag この指標は、クラスタ全体におけるレプリカの最大確認応答ラグ(秒単位)を示します。
redis.googleapis.com/cluster/replication/average_offset_diff この指標は、クラスタ全体におけるレプリケーション確認応答オフセットの平均差分(バイト単位)を示します。

レプリケーション確認応答オフセットの差分とは、レプリカとそのプライマリ クラスタ間でレプリケートされていないバイト数を意味します。
redis.googleapis.com/cluster/replication/maximum_offset_diff この指標は、クラスタ全体におけるレプリケーション オフセット差分(バイト単位)の最大値を示します。

レプリケーション オフセットの差分とは、レプリカとそのプライマリ クラスタ間でレプリケートされていないバイト数を意味します。
redis.googleapis.com/cluster/stats/total_net_input_bytes_count この指標は、クラスタのエンドポイントが受信した受信ネットワーク バイト数を示します。
redis.googleapis.com/cluster/stats/total_net_output_bytes_count この指標は、クラスタのエンドポイントが送信する送信ネットワーク バイトの数を示します。

ノードレベルの指標

これらの指標は、クラスタ内の個々のノードの健全性とパフォーマンスに関する詳細な分析情報を提供します。指標を使用してノードの問題をトラブルシューティングし、パフォーマンスを最適化できます。

指標名 説明
redis.googleapis.com/cluster/node/clients/connected_clients この指標は、クラスタノードへのアクティブなクライアント接続の数を示します(レプリカ接続を除く)。この指標を使用すると、接続上限をモニタリングし、シャードが不均衡なトラフィックを受信しているホットスポットを特定できます。
redis.googleapis.com/cluster/node/clients/blocked_clients この指標は、クラスタノードがブロックするクライアント接続の数を示します。ブロックされたクライアント接続の数が急増している場合は、多くのクライアントがオペレーションを待機している可能性があります。これにより、レイテンシが増加する可能性があります。
redis.googleapis.com/cluster/node/server/uptime この指標は、クラスタノードの稼働時間を測定します。この指標を使用すると、再起動や障害が発生せずにサーバーが連続して実行されている時間を追跡できます。
redis.googleapis.com/cluster/node/stats/connections_received_count この指標は、指定された期間内にクラスタノードで作成されたクライアント接続の合計数を追跡します。この指標を使用すると、クラスタ内の個々のノードへの接続トラフィックをモニタリングできます。これにより、負荷分散を分析し、接続アクティビティのスパイクを特定できます。
redis.googleapis.com/cluster/node/stats/rejected_connections_count この指標は、クラスタノードが maxclients 上限に達したために拒否された接続の数を示します。この指標を使用すると、ノードが接続の負荷が高い状態にあり、接続を処理できないために新しい接続を拒否しているかどうかを特定できます。
redis.googleapis.com/cluster/node/commandstats/usec_count この指標は、クラスタノードで各コマンドが消費する合計時間を示します。この指標を使用すると、コマンドのパフォーマンスを分析し、遅いコマンドを特定して、ノードレベルでレイテンシの問題をトラブルシューティングできます。
redis.googleapis.com/cluster/node/commandstats/calls_count この指標は、クラスタノードで 1 分間にコマンドが呼び出された合計数を追跡します。この指標を使用すると、トラフィック分配をモニタリングし、使用頻度の高いコマンドを特定して、個々のノードのボトルネックのトラブルシューティングを行うことができます。
redis.googleapis.com/cluster/node/cpu/utilization この指標は、クラスタノードの CPU 使用率(0.0 ~ 1.0)を示します。
redis.googleapis.com/cluster/node/stats/expired_keys_count この指標は、クラスタノード内の有効期限切れイベントの合計数を示します。この指標を使用すると、有効期間(TTL)がゼロになったためにクラスタからキーが削除されるレートをモニタリングできます。
redis.googleapis.com/cluster/node/stats/evicted_keys_count この指標は、クラスタが最大メモリ上限に達したためにクラスタノードが強制排除したキーの合計数をカウントします。この指標は、クラスタがメモリ不足の状態にあるかどうかを特定できます。削除されたキーの数が多いか増加している場合は、クラスタの容量が不足していることを示します。その結果、クラスタは新しいデータの空き容量を確保するために鍵を削除します。
redis.googleapis.com/cluster/node/keyspace/total_keys この指標は、クラスタノードが保存するキーの合計数を測定します。この指標は、ノード間のデータ分布とシャーディングを可視化します。
redis.googleapis.com/cluster/node/stats/keyspace_hits_count この指標は、クラスタノードでのキーの正常な検索の数をトラッキングします。この指標を使用すると、ノードがインメモリ データを取得する効率をモニタリングできます。
redis.googleapis.com/cluster/node/stats/keyspace_misses_count この指標は、クラスタノードでのキーの検索失敗数を追跡します。
redis.googleapis.com/cluster/node/memory/utilization この指標は、クラスタノードのメモリ使用率(0.0 ~ 1.0)を追跡します。この指標を使用して、ノード障害を回避し、クラスタの安定性を確保できます。
redis.googleapis.com/cluster/node/memory/usage この指標は、クラスタノードの合計メモリ使用量を測定します。
redis.googleapis.com/cluster/node/stats/net_input_bytes_count この指標は、クラスタノードが受信した受信ネットワーク バイトの合計数を測定します。この指標を使用すると、ネットワーク スループットをモニタリングし、潜在的なボトルネックを特定して、ノードのトラフィック スパイクを分析できます。
redis.googleapis.com/cluster/node/stats/net_output_bytes_count この指標は、クラスタノードが送信する送信ネットワーク バイトの合計数を測定します。この指標を使用して、パフォーマンス チューニングと容量計画のためにノードのネットワーク下り(外向き)トラフィック量をモニタリングできます。
redis.googleapis.com/cluster/node/replication/offset この指標は、クラスタノードのレプリケーション オフセット バイト数を測定します。クラスタのレプリカをプライマリ クラスタにプロモートする前に、この指標を使用して、レプリカがすべてのデータを処理したかどうかを確認できます。これにより、データ損失を防ぐことができます。
redis.googleapis.com/cluster/node/server/healthy この指標は、クラスタノードが使用可能で、正しく機能しているかどうかを判断します。

クロスリージョン レプリケーションの指標

このセクションでは、クロスリージョン レプリケーションの指標について説明します。

指標名 説明
redis.googleapis.com/cluster/cross_cluster_replication/secondary_replication_links この指標は、プライマリ クラスタとセカンダリ クラスタ間のシャードリンクの数を示します。クロスリージョン レプリケーション グループ内で、プライマリ クラスタは、グループ内のセカンダリ クラスタとの CRR レプリケーション リンクの数を報告します。セカンダリ クラスタごとに、この数はシャード数と同じになることが想定されます。予期せずシャード数が減少した場合、レプリケータとフォロワー間のレプリケーションが停止したシャードの数が示されます。理想的な状態では、この指標はプライマリ クラスタ シャード数と同じ値になります。
redis.googleapis.com/cluster/cross_cluster_replication/secondary_maximum_replication_offset_diff この指標は、異なるリージョンにまたがるクラスタのプライマリ シャードとセカンダリ(レプリカ)シャード間のレプリケーション オフセットの最大差(バイト単位)を測定します。
redis.googleapis.com/cluster/cross_cluster_replication/secondary_average_replication_offset_diff この指標は、異なるリージョンにまたがるクラスタのプライマリ シャードとレプリカ シャード間のレプリケーション オフセットの平均差(バイト単位)を測定します。この指標の値が高い場合は、レプリケーションの遅延を示しています。この遅延は、レプリケーションを一時停止してから再開することで解決できます。

JSON 指標

このセクションでは、JSON ドキュメントのノードレベルの指標を示します。

ノードレベルの指標

これらの指標は、JSON ドキュメントの総数と、これらのドキュメントが消費するメモリ量に関する詳細な分析情報を提供します。

指標名 説明
redis.googleapis.com/cluster/node/json/documents_count この指標は、クラスタノードにある JSON ドキュメントの合計数を測定します。この指標は、ノードレベルでインデックス登録、削除、統合されたドキュメントの数を示すため、この指標を使用してデータ分布と容量を追跡できます。
redis.googleapis.com/cluster/node/json/used_memory この指標は、JSON ドキュメントが消費するメモリの量(バイト単位または使用可能なメモリの割合)を測定します。この指標を使用すると、容量のモニタリング、メモリバウンド ノードの特定、スケーリング アクションのトリガーを行うことができます。

永続性指標

このセクションでは、永続性指標の一覧と説明を示します。

RDB 永続性指標

このセクションでは、Redis データベース(RDB)永続性指標の一覧と説明を示します。

クラスタレベルの指標

このセクションでは、クラスタレベルの RDB 永続性指標の一覧と説明を示します。

指標名 説明
redis.googleapis.com/cluster/persistence/rdb_saves_count

この指標は、クラスタノードで RDB 永続スナップショット(RDB 保存とも呼ばれます)が取得された累積回数を追跡します。この指標を使用すると、ノードごとに RDB スナップショットの頻度と成功をモニタリングできます。

指標には status_code フィールドがあります。RDB スナップショットが失敗したかどうかを確認するには、3 - INTERNAL_ERROR ステータスの status_code フィールドをフィルタします。

redis.googleapis.com/cluster/persistence/rdb_save_ages この指標は、クラスタ内のすべてのノードの分布スナップショットの経過時間を示します。復旧インシデントの場合は、この指標を使用してデータの未更新の時間枠を表示できます。理想的には、分布にはスナップショットの頻度よりも遅延時間が短い(または同じ遅延時間)の値が含まれます。

ノードレベルの指標

指標名 説明
redis.googleapis.com/cluster/node/persistence/rdb_bgsave_in_progress この指標は、クラスタノードで RDB バックグラウンド保存(BGSAVE)がアクティブかどうかを示します。ステータスが TRUE の場合、BGSAVE はアクティブです。
redis.googleapis.com/cluster/node/persistence/rdb_last_bgsave_status この指標は、クラスタノードの BGSAVE オペレーションが完了したか、エラーが発生したかを示します。ステータスが TRUE の場合、オペレーションが完了したことを意味します。
redis.googleapis.com/cluster/node/persistence/rdb_saves_count この指標は、クラスタノードで作成された RDB スナップショットの累積数を追跡します。この指標を使用して、ノードのスナップショットの頻度と成功をモニタリングできます。
redis.googleapis.com/cluster/node/persistence/rdb_last_save_age この指標は、前回の RDB スナップショットが正常に作成されてからの経過時間を秒単位で測定します。この指標を使用して、クラスタノードの RDB 永続性データの古さをモニタリングできます。
redis.googleapis.com/cluster/node/persistence/rdb_next_save_time_until この指標は、クラスタノードで次の RDB スナップショットがスケジュールされるまでの残り時間を秒単位で測定します。この指標を使用して、RDB 永続性のスケジュールをモニタリングし、次の自動スナップショットがいつ作成されるかを追跡できます。
redis.googleapis.com/cluster/node/persistence/current_save_keys_total この指標は、クラスタノードの現在の RDB 保存オペレーションで処理されるキーの合計数を追跡します。

AOF 永続性指標

このセクションでは、追加専用ファイル(AOF)の永続性指標について説明します。

クラスタレベルの指標

このセクションでは、クラスタレベルの AOF 永続性指標について説明します。

指標名 説明
redis.googleapis.com/cluster/persistence/aof_fsync_lags

この指標は、AOF へのデータの書き込みから、そのデータが永続ストレージに正常に同期されるまでの、クラスタ内のすべてのノードの時間差(遅延)を測定します。

appendfsync パラメータが everysec に設定されている場合、この指標を使用してクラスタの永続性の健全性を評価できます。理想的には、ラグの分布に、AOF の同期頻度よりもラグ時間が短い(または同じ)値が含まれていることが望ましいです。

redis.googleapis.com/cluster/persistence/aof_rewrite_count

この指標は、クラスタノードが AOF 書き換えオペレーションをトリガーした累積回数を追跡します。この指標を使用すると、パフォーマンスの問題を診断できます。これは、AOF 書き換えの頻度が高いと、クラスタでレイテンシの急増やメモリ負荷が発生する可能性があるためです。

指標には status_code フィールドがあります。AOF 書き換えが失敗したかどうかを確認するには、このフィールドを 3 - INTERNAL_ERROR ステータスでフィルタします。

ノードレベルの指標

このセクションでは、ノードレベルの AOF 永続性指標の一覧と説明を示します。

指標名 説明
redis.googleapis.com/cluster/node/persistence/aof_last_write_status この指標は、クラスタノードの AOF ファイルに対する前回の書き込みオペレーションのステータスを示します。ステータスが TRUE の場合、書き込みオペレーションは成功しています。この指標を使用すると、Memorystore for Redis Cluster がデータを正常に永続化していることを確認できます。
redis.googleapis.com/cluster/node/persistence/aof_last_bgrewrite_status この指標は、クラスタノードで前回実行された AOF bgrewrite オペレーションのステータスを示します。ステータスが TRUE の場合、オペレーションは成功しています。
redis.googleapis.com/cluster/node/persistence/aof_fsync_lag

この指標は、AOF へのデータの書き込みから、そのデータが永続ストレージに正常に同期されるまでのクラスタノードの時間差(遅延)を測定します。

appendfsync パラメータが everysec に設定されている場合、この指標を使用してノードの永続性の健全性を評価できます。データの同期処理に 1 秒以上かかる場合、永続化が受信データに遅れるため、クラッシュ シナリオでパフォーマンスの低下やデータ損失が発生する可能性があります。

redis.googleapis.com/cluster/node/persistence/aof_rewrites_count

この指標は、クラスタノードが AOF 書き換えオペレーションをトリガーした累積回数を追跡します。この指標を使用して、パフォーマンスの問題を診断できます。AOF 書き換えの頻度が高いと、クラスタのレイテンシやメモリ負荷が増加する可能性があります。

指標には status_code フィールドがあります。AOF 書き換えが失敗したかどうかを確認するには、このフィールドを 3 - INTERNAL_ERROR ステータスでフィルタします。

redis.googleapis.com/cluster/node/persistence/aof_fsync_errors_count この指標は、クラスタノードで AOF fsync() システムコールが失敗した累積回数をトラッキングします。この指標は、appendfsync パラメータが everysec または always に設定されている AOF 対応クラスタにのみ適用されます。

一般的な永続性指標

このセクションでは、AOF と RDB の両方の永続性に適用される指標の一覧と説明を示します。

ノードレベルの指標

このセクションでは、ノードレベルの AOF と RDB の永続性指標について説明します。

指標名 説明
redis.googleapis.com/cluster/node/persistence/auto_restore_count

この指標は、クラスタノードが永続性ダンプファイル(AOF または RDB)から自動的に復元された累積回数を追跡します。

指標には status_code フィールドがあります。復元が失敗したかどうかを確認するには、このフィールドを 3 - INTERNAL_ERROR ステータスでフィルタします。

永続性指標のユースケースの例

AOF 書き込みオペレーションがレイテンシとメモリ負荷の原因になっているかどうかを確認する

クラスタまたはクラスタ内のノードでレイテンシやメモリ使用量の増加が検出されたとします。この場合は、追加の使用量が AOF 永続性に関連しているかどうかを確認することをおすすめします。

AOF 書き換えオペレーションによって一時的な負荷の急増がトリガーされる可能性があるため、aof_rewrites_count 指標を調べて、クラスタまたはクラスタ内のノードの存続期間にわたる AOF 書き換えの累積数を取得できます。この指標で、書き換え数の増加がレイテンシの増加に対応していることがわかったとします。このような状況では、書き込みレートを下げるか、シャード数を増やして書き換えの頻度を下げることで、この問題に対処できます。

RDB 保存オペレーションがレイテンシとメモリ負荷の原因になっているかどうかを確認する

クラスタまたはクラスタ内のノードでレイテンシやメモリ使用量の増加が検出されたとします。この場合は、追加の使用量が RDB 永続性に関連しているかどうかを確認することをおすすめします。

RDB 保存オペレーションによって一時的な負荷の急増がトリガーされる可能性があることがわかっているため、rdb_saves_count 指標を調べて、クラスタまたはクラスタ内のノードのライフサイクル全体にわたる RDB 保存の累積数を取得できます。この指標で、RDB 保存数の増加がレイテンシの増加に対応していることがわかったとします。このような状況では、RDB スナップショット間隔を短くして、書き換えの頻度を減らすことができます。クラスタをスケールアウトして、ベースラインの負荷レベルを下げることもできます。

Memorystore for Redis Cluster の指標を解釈する

上記のリストに示されているように、指標の多くは、平均、最大、合計の 3 つのカテゴリに分かれます。

Memorystore for Redis Cluster の場合、同じ指標の平均と最大のバリエーションが提供されるため、両方の指標を使用してその指標ファミリーのホットスポットを特定できます。

指標の合計値は独立しており、ホットスポットの平均最大のバリエーションの目的とは関係なく、個別の分析情報を提供します。

平均値と最大値の指標について

クラスタの average_keyspace_hitsmaximum_keyspace_hits の値を比較するとします。2 つの指標の差が大きくなるほど、クラスタで発生するヒットのホットスポットが増加します。average_keyspace_hitsmaximum_keyspace_hits の値が近いほど、ヒットがクラスタ全体に均等に分散されていることを示します。

この原則は、同じ指標の平均および最大の変動を持つすべての指標に適用されます。

ホットスポットの例

クラスタ内のすべてのシャードの average_keyspace_hitsmaximum_keyspace_hits を比較すると、これらの値を比較することで、ホットスポットが発生している場所を特定できます。たとえば、6 シャード クラスタのシャードのヒット数が次のようになっているとします。

  • シャード 1 ~ 2 ヒット
  • シャード 2 ~ 2 ヒット
  • シャード 3 - 2 ヒット
  • シャード 4 - 2 ヒット
  • シャード 5 - 2 ヒット
  • シャード 6 ~ 8 ヒット

この例では、average_keyspace_hits は値 3 を返し、maximum_keyspace_hits は 8 を返します。これは、シャード 6 がホットであることを示しています。

クラスタ内のホットスポットを特定するために使用できるノードレベルの指標が提供されています。