Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Exporter les informations sur les tâches

Cette page explique comment exporter les informations de vos jobs stockées dans Batch vers une table BigQuery à l'aide de Workflows. Plus précisément, vous allez apprendre à exécuter l'exemple de workflow export-jobs et à afficher les informations sur le job résultant dans BigQuery.

L'exportation des informations d'un job est utile lorsque vous souhaitez les conserver après la suppression automatique ou manuelle d'un job ou pour les analyser en dehors de Batch. Si vous souhaitez exporter uniquement les informations sur les changements d'état des tâches et des jobs vers BigQuery, consultez plutôt Surveiller les jobs à l'aide des notifications.

Pour savoir comment exporter les informations sur les tâches stockées dans d'autres servicesGoogle Cloud , consultez la documentation sur l'exportation de ce service. Par exemple, consultez les pages suivantes :

Avant de commencer

Si vous n'avez jamais utilisé Batch, consultez Premiers pas avec Batch et activez Batch en remplissant les conditions préalables pour les projets et les utilisateurs.
Activez les API BigQuery et Workflows.
Rôles requis pour activer les API
Pour activer les API, vous avez besoin du rôle IAM Administrateur Service Usage (roles/serviceusage.serviceUsageAdmin), qui contient l'autorisation serviceusage.services.enable. Découvrez comment attribuer des rôles.
Activer les API

Facultatif : Identifiez un ensemble de données ou une table BigQuery existants dans votre projet où vous souhaitez stocker les informations sur le job. Une table existante doit avoir un schéma correspondant.

Sinon, vous pouvez utiliser le workflow export-jobs pour créer un ensemble de données ou une table.
Préparez un compte de service pour le workflow d'exportation des jobs en procédant comme suit :
1. Créez un compte de service ou identifiez un compte de service existant.
2. Pour vous assurer que le compte de service dispose des autorisations nécessaires pour exécuter le workflow export-jobs, demandez à votre administrateur d'accorder au compte de service les rôles IAM suivants dans le projet :
  
  Important : Vous devez accorder ces rôles au compte de service, et non à votre compte utilisateur. Si vous ne les accordez pas au bon compte principal, vous risquez de rencontrer des erreurs d'autorisation.
  - Écrire des journaux : Rédacteur de journaux (roles/logging.logWriter)
  - Créer et modifier des ensembles de données et des tables BigQuery : Administrateur BigQuery (roles/bigquery.admin)
  - Afficher et supprimer des jobs par lot : Éditeur de tâches par lot (roles/batch.jobsEditor)
  Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.
  
  Votre administrateur peut également attribuer au compte de service les autorisations requises à l'aide de rôles personnalisés ou d'autres rôles prédéfinis.
Pour obtenir les autorisations nécessaires pour créer, déployer et exécuter le workflow export-jobs, demandez à votre administrateur de vous accorder les rôles IAM suivants sur le projet :
- Afficher les jobs : Lecteur de tâches par lot (roles/batch.jobsViewer)
- Afficher les comptes de service : Afficher les comptes de service (roles/iam.serviceAccountViewer)
- Pour afficher les ensembles de données et les tables BigQuery : Lecteur de données BigQuery (roles/bigquery.dataViewer)
- Créer, déployer et exécuter des workflows : Éditeur de workflows (roles/workflows.editor)
Assurez-vous que les utilisateurs de votre projet peuvent afficher les informations sur le job exporté.

Pour vous assurer qu'un utilisateur dispose des autorisations nécessaires pour exporter les informations sur les jobs, demandez à votre administrateur de lui accorder le rôle IAM Lecteur de données BigQuery (roles/bigquery.dataViewer) sur la table, l'ensemble de données ou le projet.

Remarque : Vous ne pouvez accorder l'accès qu'aux ressources existantes. Sauf si vous prévoyez d'exporter les informations sur le job vers une table ou un ensemble de données préexistants, vous devez accorder cet accès au niveau du projet ou après avoir exporté les informations sur le job.

Exporter les informations sur les tâches

Cette section explique comment exporter des informations sur les jobs à l'aide du workflow export-jobs, qui provient de l'exemple de code export-to-bigquery. Le workflow export-jobs exporte les informations sur les jobs de votre projet qui se trouvent dans la région spécifiée et qui répondent aux critères de filtrage spécifiés.

Le workflow d'exportation des jobs exporte les informations sur les jobs vers une table spécifiée dans un ensemble de données spécifié. Ces éléments sont créés automatiquement par le workflow s'ils n'existent pas déjà dans votre projet. Par défaut, le workflow export-jobs supprime également les jobs exportés de Batch, mais vous pouvez éventuellement modifier le workflow export-jobs pour ne pas supprimer les jobs.

Pour chaque workflow export-jobs que vous souhaitez utiliser, procédez comme suit :

Configurez la définition du workflow.
Créez et déployez le workflow.
Exécutez le workflow. Répétez cette étape chaque fois que vous souhaitez exporter les jobs spécifiés.

Configurer la définition du workflow

Téléchargez le fichier export-to-bigquery-delete-batch-jobs.yaml depuis GitHub.
Ouvrez le fichier export-to-bigquery-delete-batch-jobs.yaml dans un éditeur de texte. Ensuite, apportez les modifications suivantes :
1. Remplacez sys.get_env("GOOGLE_CLOUD_PROJECT_ID") par l'ID de votre projet au format chaîne, par exemple "my-project-id".
2. Remplacez sys.get_env("GOOGLE_CLOUD_LOCATION") par la région contenant les jobs que vous souhaitez exporter, au format chaîne (par exemple, "us-central1").
3. Facultatif : Modifiez les critères de filtrage qui spécifient les tâches à exporter.
  
  Par défaut, le workflow export-jobs spécifie les critères de filtrage "(status.state:SUCCEEDED OR status.state:FAILED OR status.state:CANCELLED) AND create_time<=\"2023-05-01T00:00:00Z\"". Ces critères de filtrage par défaut n'exportent des informations que pour les jobs dont l'état est SUCCEEDED, FAILED ou CANCELLED, et qui ont été créés avant ou à la date et heure 2023-05-01T00:00:00Z du code temporel RFC 3339.
4. Facultatif : Remplacez default_dataset_id par un autre nom pour l'ensemble de données que vous souhaitez que le workflow de jobs d'exportation utilise ou crée.
5. Facultatif : Remplacez default_table_id par un autre nom de table que vous souhaitez que le workflow des jobs d'exportation utilise ou crée.
6. Si vous ne souhaitez pas que le workflow supprime les jobs exportés, procédez comme suit :
  
  Conseil : Si vous ne supprimez pas les jobs exportés, l'exécution du même workflow export-jobs peut créer des lignes en double. Pour éviter cela, vous pouvez mettre à jour les critères de filtre create_time avant chaque réexécution afin d'inclure uniquement les jobs créés après l'exécution précédente. Pour savoir comment afficher la date d'exécution précédente d'un workflow, consultez Accéder aux résultats d'exécution d'un workflow.
  1. Supprimez les lignes suivantes :
```
        - log_delete_step:
            call: sys.log
            args:
              text: ${"Deleting Batch job " + j.name}
              severity: NOTICE
        - delete_job:
            call: googleapis.batch.v1.projects.locations.jobs.delete
            args:
              name: ${j.name}
```
  2. Supprimez + " and deleted".
7. Enregistrez le fichier. Laissez le fichier ouvert.

Créer et déployer le workflow

Dans la console Google Cloud , accédez à la page Workflows :

Accéder à "Workflows"
Sur la page Workflows, cliquez sur Créer.
Dans le champ Nom du workflow, saisissez un nom pour le workflow (par exemple, export-batch-jobs-us-central1).
Dans la liste Compte de service, sélectionnez le compte de service que vous avez préparé.
Cliquez sur Suivant.
Dans l'éditeur de workflow, remplacez l'exemple de workflow par le contenu du fichier export-to-bigquery-delete-batch-jobs.yaml. Vous pouvez ensuite fermer le fichier.
Cliquez sur Déployer. La page Détails du workflow s'ouvre.

Exécuter le workflow

Sur la page Détails du workflow, cliquez sur Exécuter. La page Exécuter le workflow s'ouvre.
Sur la page Exécuter le workflow qui s'ouvre, cliquez sur Exécuter.
Sur la page Détails de l'exécution qui s'ouvre, attendez que le workflow ait fini de s'exécuter. Par exemple, le temps d'exécution pour exporter et supprimer quelques jobs est généralement de quelques secondes, mais il peut être plus long si vous exportez et supprimez de nombreux jobs.

Une fois le workflow exécuté, le volet Output (Sortie) affiche les résultats.

Afficher les informations sur le job exportées

Cette section explique comment afficher les données de table créées par le workflow export-jobs. Par exemple, vous pouvez suivre les étapes ci-dessous pour vérifier que le workflow a été exécuté correctement et parcourir les données du tableau. Pour savoir comment afficher et utiliser les informations sur les tâches exportées, par exemple pour écrire des requêtes, consultez Gérer les données de table dans la documentation BigQuery.

Dans la console Google Cloud , accédez à la page BigQuery.

Accéder à BigQuery
Dans le panneau Explorateur, ouvrez le tableau contenant les informations sur votre tâche exportée :
1. Dans le champ Rechercher des ressources BigQuery, saisissez le nom de la table issue de votre workflow de tâches d'exportation. Par exemple, le nom de table par défaut est default_table_id.
2. Cliquez sur le nom de la table. La page des détails de la table s'ouvre.
3. Sur la page d'informations de la table, cliquez sur l'onglet Détails.
  
  Dans l'onglet Détails, notez l'horodatage Dernière modification et le Nombre de lignes.
4. Sur la page d'informations de la table, cliquez sur l'onglet Aperçu.

Étapes suivantes

Apprenez-en davantage sur Workflows.
Obtenez des informations supplémentaires sur BigQuery.
En savoir plus sur Batch :

Exporter les informations sur les tâches Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Avant de commencer

Exporter les informations sur les tâches

Configurer la définition du workflow

Créer et déployer le workflow

Exécuter le workflow

Afficher les informations sur le job exportées

Étapes suivantes

Exporter les informations sur les tâches