Surveiller les volumes NetApp

Cette page explique comment surveiller les ressources et les performances de Google Cloud NetApp Volumes en collectant et en analysant les métriques avec Cloud Monitoring.

Métriques Cloud Monitoring

Diverses métriques permettant de surveiller les NetApp Volumes sont disponibles dans Cloud Monitoring. Les catégories incluent les métriques de volume, de pool de stockage et de réplication.

Vous pouvez sélectionner et représenter des métriques individuelles dans l'explorateur de métriques, créer un tableau de bord avec plusieurs graphiques, ajouter des alertes ou récupérer les données de métriques avec l'API Cloud Monitoring.

Ressources surveillées

netapp.googleapis.com précède chaque ressource surveillée. Par exemple, pour Volume, la ressource surveillée complète est netapp.googleapis.com/volume.

Ressource surveillée Champs de métadonnées de ressources
Volume labels

service_level

storage_pool

protocols
StoragePool labels

service_level
Replication service_level
BackupVault backup_crypto_key_version

Métriques sur les ressources

netapp.googleapis.com précède chaque métrique. Par exemple, la métrique complète pour la métrique volume/bytes_used est netapp.googleapis.com/volume/bytes_used.

Les métriques sont échantillonnées et envoyées à Cloud Monitoring toutes les cinq minutes. Dans l'explorateur de métriques Cloud Monitoring, sélectionnez une métrique et utilisez une période d'alignement minimale de cinq minutes pour obtenir des résultats précis.

Nom de la métrique Description Ressource surveillée Types de métriques Unité
/volume/backup_used Octets sauvegardés
(base de référence et modifications incrémentielles
).
/volume byte
/volume/bytes_used Capacité utilisée pour stocker les données
écrites sous forme de fichiers et espace supplémentaire
utilisé pour les instantanés
.
/volume byte
/volume/snapshot_bytes Capacité utilisée 
pour les instantanés.
/volume byte
/volume/allocated_bytes Capacité allouée à un volume
à partir du pool de stockage.
/volume byte
/volume/auto_tiering/tiered_bytes Espace utilisé du volume avec sélection automatique du niveau
capacité par type de niveau :
froid ou chaud.
/volume
  • froid
  • chaud
byte
/volume/auto_tiering/cold_tier_read_byte_count Capacité lue à partir du niveau froid
du volume.
/volume byte
/volume/auto_tiering/cold_tier_write_byte_count Capacité d'écriture dans le niveau à froid
du volume.
/volume byte
/volume/operation_count Nombre d'opérations
effectuées sur le volume par
les clients.
/volume
  • read
  • write
  • métadonnées
1
/volume/throughput Débit pour le type d'opération
.
/volume
  • read
  • write
  • métadonnées
byte
/volume/average_latency Latence des opérations d'E/S du volume
dans le système de stockage
/volume
  • read
  • write
  • métadonnées
ms
/volume/backup_current_transfer_bytes Quantité de données transférées
jusqu'à présent pour le job en cours.
/volume byte
/volume/backup_healthy FALSE si un transfert de sauvegarde est manqué ou a échoué. /volume BOOL
/volume/backup_last_transfer_duration Durée du dernier transfert
.
/volume sec
/volume/backup_last_transfer_size Taille du dernier job de transfert
.
/volume byte
/volume/backup_transferring État de la sauvegarde :
TRUE = en cours de transfert,
FALSE = inactif.
/volume BOOL
/volume/inode_limit Nombre d'inodes alloués au volume (plafond).


Lié à la capacité allouée
(taille) du volume
/volume 1
/volume/inode_used Nombre d'inodes utilisés sur le volume.
/volume 1
/volume/throughput_limit Débit maximal
alloué au volume.
/volume KiB/s
/storage_pool/allocated Capacité du pool allouée
aux volumes.
/storagePool byte
/storage_pool/auto_tiering/tiered_bytes Niveaux de capacité du pool de stockage
types : froid, non froid.
/storagePool
  • froid
  • non froid
byte
/storage_pool/auto_tiering/cold_tier_read_byte_count Octets lus à partir du niveau froid
du pool.
/storagePool byte
/storage_pool/auto_tiering/cold_tier_write_byte_count Octets écrits dans le niveau froid
du pool.
/storagePool byte
/storage_pool/capacity Taille totale du pool. /storagePool byte
/storage_pool/replication_status État de la réplication pour les pools flexibles régionaux
. 0 signifie
désynchronisé , 1 signifie synchronisé
et 2 signifie en cours de rattrapage.
/storagePool 1
/replication/healthy Valeurs de TRUE si
la relation n'a pas manqué
le dernier transfert planifié
et FALSE si un
transfert planifié est manqué
ou n'est pas sain.
/replication BOOL
/replication/lag_time Temps écoulé depuis l'instantané pour le transfert
pris sur la source
, y compris la durée du transfert.
/replication sec
/replication/last_
transfer_duration
Durée du dernier job de transfert.
/replication sec
/replication/last
_transfer_size
Taille du dernier job de transfert. /replication byte
/replication/current
/transfer_bytes
Quantité de données transférées
jusqu'à présent pour le job en cours.
/replication byte
/replication/transferring État de la réplication :
  • TRUE = Transfert en cours
  • FALSE = Inactif
/replication BOOL
/replication/total_
transfer_byte_count
Données cumulées transférées
pour la relation depuis sa création le
. Peut être réinitialisé sur 0
/replication byte
/backup_vault/cmek_backup_rotation_state État de la rotation des clés sur
le coffre-fort de sauvegarde.
/BackupVault Valeurs d'état
  • 0 – En attente
  • 1 – En cours
  • 2 – Terminé
  • 3 : échec
int

Cloud Monitoring vous permet également de configurer des alertes si les métriques remplissent certaines conditions. Par exemple, vous pouvez utiliser Cloud Monitoring pour déclencher des notifications administratives avant que l'espace d'un volume ne soit épuisé. Consultez la section Alertes Cloud Monitoring.

Suivre les statistiques sur les performances de volume avec Cloud Monitoring

Cloud Monitoring suit les métriques de performances suivantes par volume :

  • /volume/operation_count
  • /volume/throughput
  • /volume/average_latency

Ces métriques sont mises à jour toutes les cinq minutes et offrent un aperçu des tendances de performances pour des périodes d'un jour ou plus.

Les métriques ne reflètent que les performances du service. Pour en savoir plus, envisagez d'utiliser les outils de surveillance disponibles sur les clients. Par exemple, la latence observée sur le client peut être supérieure à celle signalée par le service si les requêtes sont mises en file d'attente sur le client avant d'être envoyées au service.

Étapes suivantes

Surveillez l'utilisation du volume.