このページでは、Cloud Monitoring で指標を収集して分析し、Google Cloud NetApp Volumes のリソースとパフォーマンスをモニタリングする方法について説明します。
Cloud Monitoring の指標
NetApp ボリュームのモニタリングに使用できるさまざまな指標は、Cloud Monitoring で確認できます。カテゴリには、ボリューム、ストレージ プール、レプリケーションの指標が含まれます。
Metrics Explorer で個々の指標を選択してグラフ化したり、複数のグラフを含むダッシュボードを作成したり、アラートを追加したり、Cloud Monitoring API で指標データを取得したりできます。
モニタリング対象リソース
netapp.googleapis.com は、各モニタリング対象リソースの前に付加されます。たとえば、Volume の場合、完全なモニタリング対象リソースは netapp.googleapis.com/volume です。
| モニタリング対象リソース | リソース メタデータ フィールド |
|---|---|
Volume |
labels
service_level
storage_pool
protocols
|
StoragePool |
labels
service_level
|
Replication |
service_level |
BackupVault |
backup_crypto_key_version |
リソースの指標
各指標の前に netapp.googleapis.com が付いています。たとえば、volume/bytes_used 指標の完全な指標は netapp.googleapis.com/volume/bytes_used です。
指標は 5 分ごとにサンプリングされ、Cloud Monitoring に push されます。Cloud Monitoring の Metrics Explorer で指標を選択し、正確な結果を得るために最小アライメント期間を 5 分に設定します。
| 指標名 | 説明 | モニタリング対象リソース | 指標タイプ | ユニット |
|---|---|---|---|---|
/volume/backup_used |
バックアップされたバイト数 (ベースラインと 増分変更)。 |
/volume |
byte |
|
/volume/bytes_used |
ファイルとして書き込まれたデータの保存に使用される容量と、スナップショットに使用される追加容量。 |
/volume |
byte |
|
/volume/snapshot_bytes |
スナップショットに使用される容量 。 |
/volume |
byte |
|
/volume/allocated_bytes |
ストレージ プールからボリュームに割り当てられた容量。 |
/volume |
byte |
|
/volume/auto_tiering/tiered_bytes |
階層化タイプ(コールドまたはホット)別の自動階層化ボリュームの使用済み容量。 |
/volume |
|
byte |
/volume/auto_tiering/cold_tier_read_byte_count |
ボリュームのコールド層から読み取られた容量。 |
/volume |
byte |
|
/volume/auto_tiering/cold_tier_write_byte_count |
ボリュームのコールド層に書き込まれた容量。 |
/volume |
byte |
|
/volume/operation_count |
クライアントがボリュームに対して実行しているオペレーションの数。 |
/volume |
|
1 |
/volume/throughput |
オペレーション タイプのスループット。 |
/volume |
|
byte |
/volume/average_latency |
ストレージ システム内のボリューム I/O オペレーションのレイテンシ |
/volume |
|
ms |
/volume/backup_current_transfer_bytes |
現在のジョブでこれまでに転送されたデータ量。 |
/volume |
byte |
|
/volume/backup_healthy |
バックアップの転送が失敗したか、手動バックアップが失敗した場合は FALSE。 |
/volume |
BOOL |
|
/volume/backup_last_transfer_duration |
前回の転送ジョブの期間。 |
/volume |
sec |
|
/volume/backup_last_transfer_size |
前回の転送 ジョブのサイズ。 |
/volume |
byte |
|
/volume/backup_transferring |
バックアップのステータス: TRUE = 転送中、 FALSE = アイドル。 |
/volume |
BOOL |
|
/volume/inode_limit |
ボリュームに割り当てられた inode(ハードキャップ)。 ボリュームの割り当て容量(サイズ)に関連付けられています。 |
/volume |
1 |
|
/volume/inode_used |
Volume で使用されている inode の数。 |
/volume |
1 |
|
/volume/throughput_limit |
ボリュームに割り当てられた最大スループット 。 |
/volume |
KiB/s |
|
/storage_pool/allocated |
ボリュームに割り当てられたプール容量。 |
/storagePool |
byte |
|
/storage_pool/auto_tiering/tiered_bytes |
ストレージ プールの容量階層化 タイプ: コールド、非コールド。 |
/storagePool |
|
byte |
/storage_pool/auto_tiering/cold_tier_read_byte_count |
プールのコールド層から読み取られたバイト数。 |
/storagePool |
byte |
|
/storage_pool/auto_tiering/cold_tier_write_byte_count |
プールのコールド層に書き込まれたバイト数。 |
/storagePool |
byte |
|
/storage_pool/capacity |
プールの合計サイズ。 | /storagePool |
byte |
|
/storage_pool/replication_status |
リージョン フレックス プールのレプリケーションのステータス。0 は 同期していないことを意味し、1 は同期していることを意味し、2 は追いついていることを意味します。 |
/storagePool |
1 |
|
/replication/healthy |
関係が最後のスケジュールされた転送を逃していない場合は TRUE の値、スケジュールされた転送が失敗した場合、または正常でない場合は FALSE の値。 |
/replication |
BOOL |
|
/replication/lag_time |
転送用のスナップショットがソースで取得されてからの時間(転送時間を含む)。 |
/replication |
sec |
|
/replication/last_ |
前回の 転送ジョブの期間。 |
/replication |
sec |
|
/replication/last |
前回の転送ジョブのサイズ。 | /replication |
byte |
|
/replication/current |
現在のジョブでこれまでに転送されたデータ量。 |
/replication |
byte |
|
/replication/transferring |
レプリケーションのステータス:
|
/replication |
BOOL |
|
/replication/total_ |
関係が作成されてから転送されたデータの累積量。 0 にリセットされることがあります |
/replication |
byte |
|
/backup_vault/cmek_backup_rotation_state |
バックアップ Vault の鍵のローテーションの状態。 |
/BackupVault |
状態の値
|
int |
Cloud Monitoring では、指標が特定の条件を満たした場合にアラートを設定することもできます。たとえば、Cloud Monitoring を使用して、ボリュームの容量が不足する前に管理通知をトリガーできます。Cloud Monitoring アラートをご覧ください。
Cloud Monitoring でボリューム パフォーマンスの統計情報を追跡する
Cloud Monitoring は、ボリュームごとに次のパフォーマンス指標を追跡します。
/volume/operation_count/volume/throughput/volume/average_latency
これらの指標は 5 分ごとに更新され、1 日以上の期間のパフォーマンスの傾向の概要を確認できます。
指標にはサービス パフォーマンスのみが反映されます。詳細については、クライアントで利用可能なモニタリング ツールを使用することを検討してください。たとえば、リクエストがサービスに送信される前にクライアントでキューに登録されると、クライアントで観測されるレイテンシがサービスによって報告されるレイテンシよりも長くなることがあります。