监控 NetApp 卷

本页面介绍如何通过 Cloud Monitoring 收集和分析指标,监控 Google Cloud NetApp Volumes 资源和性能。

Cloud Monitoring 指标

Cloud Monitoring 中提供了各种用于监控 NetApp Volumes 的指标。类别包括卷、存储池和复制指标。

您可以在 Metrics Explorer 中选择并绘制各个指标的图表,创建包含多个图表的信息中心,添加提醒,或使用 Cloud Monitoring API 检索指标数据。

受监控的资源

netapp.googleapis.com 位于每个受监控的资源之前。例如,对于,完整的受监控的资源为 netapp.googleapis.com/volume

受监控的资源 资源元数据字段
Volume labels

service_level

storage_pool

protocols
StoragePool labels

service_level
Replication service_level
BackupVault backup_crypto_key_version

资源指标

每个指标前面都有 netapp.googleapis.com。例如,volume/bytes_used 指标的完整指标为 netapp.googleapis.com/volume/bytes_used

系统每 5 分钟对指标进行一次采样,然后将其推送到 Cloud Monitoring。 在 Cloud Monitoring 的 Metrics Explorer 中,选择一个指标,并使用至少 5 分钟的对齐周期,以获得准确的结果。

指标名称 说明 受监控的资源 指标类型 单位
/volume/backup_used 备份的字节数
(基准和
增量更改)。
/volume byte
/volume/bytes_used 用于存储以文件形式写入的数据的容量
以及用于存储快照的额外空间

/volume byte
/volume/snapshot_bytes 用于快照的容量使用情况
/volume byte
/volume/allocated_bytes 从存储池分配给卷
的容量。
/volume byte
/volume/auto_tiering/tiered_bytes 自动分层卷按分层类型(冷或热)划分的已用
容量。
/volume
  • 冷调
  • 热门
byte
/volume/auto_tiering/cold_tier_read_byte_count 从卷的冷
层读取的容量。
/volume byte
/volume/auto_tiering/cold_tier_write_byte_count 写入卷的冷存储层的容量。
/volume byte
/volume/operation_count 客户端正在卷上执行的操作数。

/volume
  • 读取
  • write
  • 元数据
1
/volume/throughput
操作类型的吞吐量。
/volume
  • 读取
  • write
  • 元数据
byte
/volume/average_latency 存储系统中的卷 I/O 操作延迟时间
/volume
  • 读取
  • write
  • 元数据
ms
/volume/backup_current_transfer_bytes 当前作业到目前为止已转移的数据量。
/volume byte
/volume/backup_healthy 如果备份转移
被错过或失败,或者
经历了手动备份失败,则为 FALSE
/volume BOOL
/volume/backup_last_transfer_duration 上次转移作业的时长。
/volume sec
/volume/backup_last_transfer_size 上次转移作业的大小。
/volume byte
/volume/backup_transferring 备份状态:
TRUE = 正在传输,
FALSE = 空闲。
/volume BOOL
/volume/inode_limit 为卷分配的 inode(硬上限)。


与卷的已分配容量
(大小)相关联
/volume 1
/volume/inode_used 卷上正在使用的 inode 数量。
/volume 1
/volume/throughput_limit 为卷分配的最大吞吐量
/volume KiB/s
/storage_pool/allocated 分配给卷的池容量。
/storagePool byte
/storage_pool/auto_tiering/tiered_bytes 存储池容量分层
类型:冷存储层、非冷存储层。
/storagePool
  • 冷调
  • 非冷调
byte
/storage_pool/auto_tiering/cold_tier_read_byte_count 从池的冷存储层级读取的字节数。
/storagePool byte
/storage_pool/auto_tiering/cold_tier_write_byte_count 写入池的冷存储层 (
) 的字节数。
/storagePool byte
/storage_pool/capacity 资金池的总规模。 /storagePool byte
/storage_pool/replication_status
区域级灵活池的复制状态。0 表示
不同步,1 表示已同步
,2 表示正在追赶。
/storagePool 1
/replication/healthy 如果关系未错过上次预定转移,则值为 TRUE;如果错过了预定转移或关系不正常,则值为 FALSE




/replication BOOL
/replication/lag_time
来源上拍摄的
转移快照以来经过的时间,包括转移时长。
/replication sec
/replication/last_
transfer_duration
上次
转移作业的持续时间。
/replication sec
/replication/last
_transfer_size
上次转移作业的大小。 /replication byte
/replication/current
/transfer_bytes
当前作业到目前为止已转移的数据量。
/replication byte
/replication/transferring 复制状态:
  • TRUE = 正在转移
  • FALSE = 空闲
/replication BOOL
/replication/total_
transfer_byte_count
自创建以来,关系累计转移的数据量
(以字节为单位)。
可能会重置为 0
/replication byte
/backup_vault/cmek_backup_rotation_state 备份保险库中密钥轮替的状态。
/BackupVault 状态值
  • 0 - 待处理
  • 1 - 进行中
  • 2 - 已完成
  • 3 - 失败
int

Cloud Monitoring 还允许您在指标满足特定条件时设置提醒。例如,您可以使用 Cloud Monitoring 在卷中的空间即将用尽之前触发管理通知。请参阅 Cloud Monitoring 提醒

使用 Cloud Monitoring 跟踪卷性能统计信息

Cloud Monitoring 会跟踪每个卷的以下性能指标:

  • /volume/operation_count
  • /volume/throughput
  • /volume/average_latency

这些指标每 5 分钟更新一次,可提供一天或更长时间段的效果趋势概览。

这些指标仅反映服务效果。您可以考虑使用客户端上提供的监控工具来了解更多详情。例如,如果请求在发送到服务之前在客户端上排队,则客户端上观察到的延迟时间可能高于服务报告的延迟时间。

后续步骤

监控音量使用情况