本页面介绍如何通过 Cloud Monitoring 收集和分析指标,监控 Google Cloud NetApp Volumes 资源和性能。
Cloud Monitoring 指标
Cloud Monitoring 中提供了各种用于监控 NetApp Volumes 的指标。类别包括卷、存储池和复制指标。
您可以在 Metrics Explorer 中选择并绘制各个指标的图表,创建包含多个图表的信息中心,添加提醒,或使用 Cloud Monitoring API 检索指标数据。
受监控的资源
netapp.googleapis.com 位于每个受监控的资源之前。例如,对于卷,完整的受监控的资源为 netapp.googleapis.com/volume。
| 受监控的资源 | 资源元数据字段 |
|---|---|
Volume |
labels
service_level
storage_pool
protocols
|
StoragePool |
labels
service_level
|
Replication |
service_level |
BackupVault |
backup_crypto_key_version |
资源指标
每个指标前面都有 netapp.googleapis.com。例如,volume/bytes_used 指标的完整指标为 netapp.googleapis.com/volume/bytes_used。
系统每 5 分钟对指标进行一次采样,然后将其推送到 Cloud Monitoring。 在 Cloud Monitoring 的 Metrics Explorer 中,选择一个指标,并使用至少 5 分钟的对齐周期,以获得准确的结果。
| 指标名称 | 说明 | 受监控的资源 | 指标类型 | 单位 |
|---|---|---|---|---|
/volume/backup_used |
备份的字节数 (基准和 增量更改)。 |
/volume |
byte |
|
/volume/bytes_used |
用于存储以文件形式写入的数据的容量 以及用于存储快照的额外空间 。 |
/volume |
byte |
|
/volume/snapshot_bytes |
用于快照的容量使用情况 。 |
/volume |
byte |
|
/volume/allocated_bytes |
从存储池分配给卷 的容量。 |
/volume |
byte |
|
/volume/auto_tiering/tiered_bytes |
自动分层卷按分层类型(冷或热)划分的已用 容量。 |
/volume |
|
byte |
/volume/auto_tiering/cold_tier_read_byte_count |
从卷的冷 层读取的容量。 |
/volume |
byte |
|
/volume/auto_tiering/cold_tier_write_byte_count |
写入卷的冷存储层的容量。 |
/volume |
byte |
|
/volume/operation_count |
客户端正在卷上执行的操作数。 |
/volume |
|
1 |
/volume/throughput |
操作类型的吞吐量。 |
/volume |
|
byte |
/volume/average_latency |
存储系统中的卷 I/O 操作延迟时间 |
/volume |
|
ms |
/volume/backup_current_transfer_bytes |
当前作业到目前为止已转移的数据量。 |
/volume |
byte |
|
/volume/backup_healthy |
如果备份转移 被错过或失败,或者 经历了手动备份失败,则为 FALSE。 |
/volume |
BOOL |
|
/volume/backup_last_transfer_duration |
上次转移作业的时长。 |
/volume |
sec |
|
/volume/backup_last_transfer_size |
上次转移作业的大小。 |
/volume |
byte |
|
/volume/backup_transferring |
备份状态: TRUE = 正在传输, FALSE = 空闲。 |
/volume |
BOOL |
|
/volume/inode_limit |
为卷分配的 inode(硬上限)。
与卷的已分配容量 (大小)相关联 |
/volume |
1 |
|
/volume/inode_used |
卷上正在使用的 inode 数量。 |
/volume |
1 |
|
/volume/throughput_limit |
为卷分配的最大吞吐量 。 |
/volume |
KiB/s |
|
/storage_pool/allocated |
分配给卷的池容量。 |
/storagePool |
byte |
|
/storage_pool/auto_tiering/tiered_bytes |
存储池容量分层 类型:冷存储层、非冷存储层。 |
/storagePool |
|
byte |
/storage_pool/auto_tiering/cold_tier_read_byte_count |
从池的冷存储层级读取的字节数。 |
/storagePool |
byte |
|
/storage_pool/auto_tiering/cold_tier_write_byte_count |
写入池的冷存储层 ( ) 的字节数。 |
/storagePool |
byte |
|
/storage_pool/capacity |
资金池的总规模。 | /storagePool |
byte |
|
/storage_pool/replication_status |
区域级灵活池的复制状态。0 表示 不同步,1 表示已同步 ,2 表示正在追赶。 |
/storagePool |
1 |
|
/replication/healthy |
如果关系未错过上次预定转移,则值为 TRUE;如果错过了预定转移或关系不正常,则值为 FALSE。 |
/replication |
BOOL |
|
/replication/lag_time |
自 来源上拍摄的 转移快照以来经过的时间,包括转移时长。 |
/replication |
sec |
|
/replication/last_ |
上次 转移作业的持续时间。 |
/replication |
sec |
|
/replication/last |
上次转移作业的大小。 | /replication |
byte |
|
/replication/current |
当前作业到目前为止已转移的数据量。 |
/replication |
byte |
|
/replication/transferring |
复制状态:
|
/replication |
BOOL |
|
/replication/total_ |
自创建以来,关系累计转移的数据量 (以字节为单位)。 可能会重置为 0 |
/replication |
byte |
|
/backup_vault/cmek_backup_rotation_state |
备份保险库中密钥轮替的状态。 |
/BackupVault |
状态值
|
int |
Cloud Monitoring 还允许您在指标满足特定条件时设置提醒。例如,您可以使用 Cloud Monitoring 在卷中的空间即将用尽之前触发管理通知。请参阅 Cloud Monitoring 提醒。
使用 Cloud Monitoring 跟踪卷性能统计信息
Cloud Monitoring 会跟踪每个卷的以下性能指标:
/volume/operation_count/volume/throughput/volume/average_latency
这些指标每 5 分钟更新一次,可提供一天或更长时间段的效果趋势概览。
这些指标仅反映服务效果。您可以考虑使用客户端上提供的监控工具来了解更多详情。例如,如果请求在发送到服务之前在客户端上排队,则客户端上观察到的延迟时间可能高于服务报告的延迟时间。