Collecter des métriques de ressources supplémentaires à l'aide de l'agent Ops

Ce document explique comment créer et exécuter un job par lot qui installe automatiquement l'agent Ops. Installez l'agent Ops pour fournir des métriques supplémentaires dans Cloud Monitoring sur les performances des ressources d'une tâche. Pour en savoir plus sur l'utilisation des métriques de performances des ressources pour une tâche, consultez Surveiller et optimiser les ressources des tâches en affichant les métriques.

Avant de commencer

  1. Si vous n'avez jamais utilisé Batch, consultez Premiers pas avec Batch et activez Batch en remplissant les prérequis pour les projets et les utilisateurs.
  2. Si ce n'est pas déjà fait, activez les API Cloud Monitoring et Cloud Logging :

    Rôles requis pour activer les API

    Pour activer les API, vous avez besoin du rôle IAM Administrateur d'utilisation du service (roles/serviceusage.serviceUsageAdmin), qui contient l'autorisation serviceusage.services.enable. Découvrez comment attribuer des rôles.

    Activer les API

  3. Pour obtenir les autorisations nécessaires pour créer une tâche, demandez à votre administrateur de vous accorder les rôles IAM suivants :

    Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

    Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

  4. Sauf si vous utilisez la configuration par défaut pour le compte de service de la tâche, assurez-vous qu'il dispose des autorisations nécessaires.

    Pour vous assurer que le compte de service de la tâche dispose des autorisations nécessaires pour écrire des métriques de l'agent Ops dans Monitoring, demandez à votre administrateur d'accorder les rôles IAM suivants au compte de service de la tâche :

  5. Assurez-vous que la configuration de tâche prévue répond aux exigences de l'agent Ops.

Exigences de l'agent Ops

Pour créer et exécuter une tâche qui utilise l'agent Ops, votre tâche doit répondre à toutes les exigences suivantes :

Pour en savoir plus sur les fonctionnalités et les exigences de l'agent Ops, consultez Présentation de l'agent Ops dans la documentation Google Cloud Observability.

Créer une tâche qui installe automatiquement l'agent Ops

Utilisez Google Cloud CLI ou l'API REST pour créer une tâche qui inclut le installOpsAgent champ défini sur true dans le allocationPolicy.instances champ du corps principal du fichier JSON :

"allocationPolicy": {
  "instances": [
    {
      "installOpsAgent": true
    }
  ]
}

Par exemple, une tâche qui installe automatiquement l'agent Ops peut avoir un fichier de configuration JSON semblable à celui-ci :

{
  "taskGroups": [
    {
      "taskSpec": {
        "runnables": [
          {
            "script": {
              "text": "echo Hello World! This is task $BATCH_TASK_INDEX."
            }
          }
        ]
      },
      "taskCount": 3,
    }
  ],
  "allocationPolicy": {
    "instances": [
      {
        "installOpsAgent": true
      }
    ]
  },
  "logsPolicy": {
      "destination": "CLOUD_LOGGING"
  }
}

Une fois les VM de la tâche en cours d'exécution, vous pouvez afficher les métriques de l'agent Ops comme n'importe quelle autre métrique de ressource. Pour en savoir plus, consultez Surveiller et optimiser les ressources des tâches en affichant les métriques.

Étape suivante

  • Si vous rencontrez des problèmes lors de la création ou de l'exécution d'une tâche, consultez la section Dépannage.
  • Afficher les tâches.
  • Découvrez d'autres options de création de tâches .