高いレイテンシの原因となるトランザクションを特定する

システム分析情報ダッシュボードと組み込みの統計テーブルを使用して、Spanner Omni で高レイテンシを引き起こすトランザクションを特定します。Spanner Omni は、複数の並列トランザクションの整合性を保証するために、ロックを使用してデータへのアクセスを制御します。多くのトランザクションが同じロックに頻繁にアクセスする必要があり、レイテンシが大きくなる場合、ロックの競合が発生します。

Spanner Omni のオペレーションは、オペレーションが読み取り / 書き込みトランザクションに含まれるときにロックを取得します。読み取り専用トランザクションはロックを取得しません。

高いレイテンシの原因となるトランザクションを特定する手順は次のとおりです。

  1. システム分析情報を使用してレイテンシの急増を確認する

  2. ロック待機時間指標を使用してロック競合の問題を特定する

  3. 問題のあるトランザクションを特定する

始める前に

まだ行っていない場合は、Spanner Omni コンソールをダウンロードしてインストールします。詳細については、Spanner Omni のダウンロードSpanner Omni コンソールを起動するをご覧ください。

システム分析情報を使用してレイテンシの急増を確認する

Spanner Omni は Cloud Monitoring を使用しません。代わりに、Spanner Omni コンソールのシステム分析情報ダッシュボードまたは Grafana を使用します。Spanner Omni コンソールでレイテンシの急増を確認する手順は次のとおりです。

  1. Spanner Omni コンソールで、ナビゲーション ペインの [システム分析情報] をクリックします。

  2. システム分析情報ダッシュボードで、次のレイテンシ グラフを確認します。

    • リクエストのレイテンシ(P50P90P99

    • トランザクション レイテンシ(P50P90P99

    レイテンシ グラフで、書き込みオペレーションの 99 パーセンタイル(P99)を確認します。レイテンシが急増しているのに、CPU 使用率やエラーが急増していない場合は、レイテンシはロックの競合の問題が原因である可能性があります。

ロック競合の問題を確認する

高レイテンシの原因がロックの競合であるかどうかを確認するには、システム分析情報ダッシュボードで使用可能なロック待機時間指標を使用します。

ロックの待機時間が長いことを確認する

Spanner Omni コンソールのシステム分析情報ダッシュボードで、ロックの待機時間が長いことを確認します。

  1. [ロック待機時間] グラフを見つけます。このグラフには、選択したデータベースのロック競合のロック待機時間の合計が 5 分間隔で表示されます。

  2. この指標に、観測されたレイテンシの急増と相関する増加が見られるかどうかを確認します。

システム テーブルを使用してロックの待機データを分析する

ロック競合がレイテンシの原因であることを確認したら、システム統計情報テーブルを使用してロック待機データを分析し、競合の原因となっているトランザクションを特定します。Spanner Omni CLI を使用して、Spanner ドキュメントの統計情報テーブルをクエリできます。

ロック統計情報テーブルの詳細については、Spanner ドキュメントのロックの統計情報をご覧ください。

競合するトランザクションを特定する

レイテンシが高い原因となっている特定のトランザクションを特定するには、データベースのトランザクション統計情報を調べます。平均レイテンシが高いトランザクションに焦点を当てます。トランザクションの形状を最適化してレイテンシを短縮します。Spanner ドキュメントのロックの競合を減らすためのおすすめの方法を検討します。

トランザクション統計情報テーブルの詳細については、Spanner のドキュメントのトランザクションの統計情報をご覧ください。

次のステップ