Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

問題のトラブルシューティング

このページでは、さまざまなエラーのシナリオと、それらのエラーを解決するためのガイダンスについて説明します。

レプリケーションのシナリオ

このセクションでは、インスタンスで発生する可能性のあるレプリケーションの問題について説明します。

レプリケーションの遅延をモニタリングするにはどうすればよいですか？

Memorystore for Valkey には /instance/replication/maximum_offset_diff 指標があります。この指標は、プライマリインスタンスのノードの最大レプリケーションオフセット差分（バイト単位）をモニタリングします。

レプリケーションオフセットの差を小さくすることで、レプリカは増分同期オペレーションをフル同期オペレーションよりも頻繁に、低コストで実行できます。

maximum_offset_diff 指標のしきい値を設定することをおすすめします。しきい値を超えると、Memorystore for Valkey はアラートで通知できます。

インスタンスのノードタイプに基づいて、次のようにしきい値を設定することをおすすめします。

ノードタイプが shared-core-nano、custom-pico、custom-micro、custom-mini、standard-small、highmem-medium、highcpu-medium、standard-large のいずれかである場合は、しきい値を 64 MB 未満に設定します。
ノードタイプが highmem-xlarge または highmem-2xlarge の場合は、しきい値を 1 GB 未満に設定します。

注意: このノードタイプには SLA がないため、shared-core-nano ノードタイプは開発またはテスト目的でのみ使用することをおすすめします。本番環境で Memorystore for Valkey を実行する場合は、別のノードタイプを使用することをおすすめします。これらのノードタイプの詳細については、ノードタイプを選択するをご覧ください。

プライマリインスタンスとそのレプリカ間にレプリケーションラグがある場合はどうすればよいですか？

プライマリインスタンスの書き込みオペレーションが多すぎると、レプリカがこれらのオペレーションを複製できず、レプリケーションラグが大幅に発生する可能性があります。この問題を解決するには、インスタンスのシャード数を増やして、インスタンスの容量をスケーリングすることをおすすめします。

CPU 使用率のシナリオ

このセクションでは、インスタンスで発生する可能性がある CPU 使用率の問題について説明します。

インスタンスの出力バッファの空き容量がなくなった場合はどうすればよいですか？

Memorystore for Valkey インスタンスの出力バッファの容量が不足した場合は、次の操作を行います。

maxmemory パラメータに小さい値を設定します。
allkeys-lru maxmemory ポリシーを使用します。

インスタンスのメモリがいっぱいになり、新しい書き込みが発生すると、Memorystore for Valkey はインスタンスの maxmemory ポリシーに基づいてキーを削除し、書き込み用にスペースを確保します。allkeys-lru ポリシーは、キーセット全体から最近使用されていない（LRU）キーを削除します。

インスタンスの maxmemory と使用済みメモリをモニタリングすることをおすすめします。これにより、インスタンスがプロビジョニングされたインスタンス容量に達したかどうかを確認できます。また、maxmemory パラメータの値を小さくすると、オーバーヘッド用のスペースが増えます。

メモリ管理のシナリオ

このセクションでは、インスタンスで発生する可能性があるメモリ管理の問題について説明します。

インスタンスがメモリ不足であることを判断するために使用できる指標はどれですか？

Memorystore for Valkey インスタンスのメモリ使用量をモニタリングするには、/instance/memory/maximum_utilization 指標を表示することをおすすめします。インスタンスのメモリ使用量が 80% に近づき、データ使用量の増加が見込まれる場合は、パフォーマンスを向上させ、新しいデータのスペースを確保するために、インスタンスのサイズをスケールアップします。

モニタリングのシナリオ

このセクションでは、インスタンスで発生する可能性があるモニタリングの問題について説明します。

Memorystore for Valkey のアラートを設定するにはどうすればよいですか？

Cloud Monitoring を使用して、インスタンスに設定したしきい値を超えた指標がある場合に通知するアラートを設定できます。Cloud Monitoring でアラートを設定する方法については、メモリ使用量に対するモニタリングアラートを設定するをご覧ください。

接続管理のシナリオ

このセクションでは、インスタンスで発生する可能性がある接続管理の問題について説明します。

接続数の上限に達した場合や、接続タイムアウトが発生した場合は、どうすればよいですか？

接続上限に達すると、クライアントはサーバーに接続できません。これは接続拒否と呼ばれます。

この場合は、次の手順を行います。

/instance/node/stats/rejected_connections_count 指標を使用して、インスタンスノードが最大クライアント上限に達したために Memorystore for Valkey が拒否した接続の数を特定します。
/instance/node/clients/connected_clients 指標を使用して、インスタンスノードに接続されているクライアントの数を特定します。これにより、インスタンス内のすべてのノードが上限を下回っているかどうかを確認できます。
client kill コマンドを使用して、リークした接続や不要な接続を停止します。
クライアントアプリケーションの接続数またはプールサイズを減らします。詳細については、クライアントアプリケーションに関連するドキュメントをご覧ください。
最大クライアント上限を調整します。詳細については、インスタンスを構成するをご覧ください。
インスタンスの接続上限が高くなるように、インスタンスをより大きなノードタイプにスケールアップします。

タイムアウトのシナリオ

このセクションでは、インスタンスで発生する可能性があるタイムアウトの問題について説明します。

I/O タイムアウトを受け取った場合はどうすればよいですか？

Memorystore for Valkey の読み取りまたは書き込みオペレーションが指定された時間内に完了しないと、I/O タイムアウトが発生します。このタイムアウトは、さまざまな理由で発生する可能性があります。たとえば、インスタンスの 1 つ以上のノードが過負荷になっている可能性があります。

I/O タイムアウトが発生した場合は、次の操作を行います。

instance/cpu/maximum_utilization 指標を使用して、インスタンス内のノードの CPU 使用率を 0.0（0%）から 1.0（100%）の範囲で確認します。すべてのノードの CPU 使用率が 80% 未満になるようにすることをおすすめします。詳細については、CPU 使用率のベストプラクティスをご覧ください。
サーバーがタイムアウトしたためにクライアントがサーバーから切断された場合は、指数バックオフとジッターを使用して再試行します。これにより、複数のクライアントが同時にサーバーに過負荷をかけるのを防ぐことができます。

接続性エラーのシナリオ

このセクションでは、インスタンスで発生する可能性がある接続性の問題について説明します。

ファイアウォールルールによる接続エラー

ファイアウォールルールでは、Memorystore for Valkey で使用されるポートをブロックすることによる接続エラーが発生することがあります。インスタンスの両方の Private Service Connect エンドポイントですべてのポートを許可リストに登録する必要があります。エンドポイントの詳細については、予約済みのネットワークアドレスをご覧ください。

組織のポリシーによる接続エラー

Memorystore for Valkey インスタンスへの Private Service Connect 接続をブロックする組織のポリシーを設定できます。

組織のポリシーで .restrictPrivateServiceConnectProducer ポリシーを使用している場合は、フォルダ番号 672235397475（Memorystore for Valkey 専用のフォルダ）を許可リストに登録します。次に例を示します。

name: organizations/Consumer-org-1/policies/compute.restrictPrivateServiceConnectProducer
spec:
    rules:
      - values:
          allowedValues:
          - under:folders/672235397475

組織のポリシーで .disablePrivateServiceConnectCreationForConsumers ポリシーを使用している場合は、SERVICE_PRODUCERS を許可リストに登録します。次に例を示します。

name: organizations/Consumer-org-1/policies/compute.disablePrivateServiceConnectCreationForConsumers
spec:
    rules:
      - values:
          allowedValues:
          - SERVICE_PRODUCERS

クラスタモードが無効になっているインスタンスのエラー処理

リードレプリカのないインスタンスの読み取りエンドポイントにアプリケーションが接続すると、接続が閉じ、ERR no replicas found エラーメッセージが表示されます。この場合は、アプリケーションをプライマリエンドポイントに接続するか、インスタンスにリードレプリカを追加します。
フェイルオーバーが発生すると、アプリケーションからの既存の接続が閉じられ、ERR role change occurred エラーメッセージが表示されます。このエラーメッセージは、アプリケーションがインスタンスの読み取りエンドポイントに接続し、インスタンスのすべてのリードレプリカが失敗した場合にも表示されます。この場合、アプリケーションは指数バックオフを使用して接続を再試行する必要があります。

永続性のシナリオ

このセクションでは、インスタンスで発生する可能性がある永続性の問題について説明します。

書き込みトラフィックが、Memorystore for Valkey の AOF 書き換えによるスペースの圧縮と再利用の能力を超えている

この状況が発生すると、Append-Only File（AOF）が書き換えプロセスで管理できるよりも速く増加します。これにより、ディスクが枯渇し、書き込みエラーが発生し、レプリカの作成と完全同期を必要とするオペレーションがブロックされます。

Memorystore for Valkey は、書き込みスループットを調整するガードレールを実装しました。これにより、AOF の書き換えは、持続的な高書き込みワークロードに対応できます。

問題のトラブルシューティング コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

レプリケーションのシナリオ

レプリケーションの遅延をモニタリングするにはどうすればよいですか？

プライマリ インスタンスとそのレプリカ間にレプリケーション ラグがある場合はどうすればよいですか？

CPU 使用率のシナリオ

インスタンスの出力バッファの空き容量がなくなった場合はどうすればよいですか？

メモリ管理のシナリオ

インスタンスがメモリ不足であることを判断するために使用できる指標はどれですか？

モニタリングのシナリオ

Memorystore for Valkey のアラートを設定するにはどうすればよいですか？

接続管理のシナリオ

接続数の上限に達した場合や、接続タイムアウトが発生した場合は、どうすればよいですか？

タイムアウトのシナリオ

I/O タイムアウトを受け取った場合はどうすればよいですか？

接続性エラーのシナリオ

ファイアウォール ルールによる接続エラー

組織のポリシーによる接続エラー

クラスタモードが無効になっているインスタンスのエラー処理

永続性のシナリオ

書き込みトラフィックが、Memorystore for Valkey の AOF 書き換えによるスペースの圧縮と再利用の能力を超えている

問題のトラブルシューティング

プライマリインスタンスとそのレプリカ間にレプリケーションラグがある場合はどうすればよいですか？

ファイアウォールルールによる接続エラー