Ce document explique comment accéder aux journaux de pipeline et de service pour Cloud Data Fusion et les afficher.
À partir de la version 6.11 de Cloud Data Fusion, les journaux de pipeline et de service sont disponibles dans Cloud Logging.
À propos des types de journaux
Cloud Data Fusion génère plusieurs types de journaux pour vous aider à surveiller et à résoudre les problèmes liés aux processus d'intégration de données :
Tarifs
L'utilisation de Cloud Logging et Cloud Monitoring entraîne des frais. Pour en savoir plus, consultez les tarifs de Google Cloud Observability.
Facultatif : Importer le tableau de bord Cloud Data Fusion Logging
Pour afficher les journaux de pipeline et de service à l'aide du tableau de bord Cloud Data Fusion Logging, importez le tableau de bord :
Dans la console Google Cloud , accédez à la page Tableaux de bord de Cloud Monitoring.
Cliquez sur Afficher les modèles de tableaux de bord.
Recherchez Journalisation Cloud Data Fusion et sélectionnez le tableau de bord.
Cliquez sur Ajouter le tableau de bord de journalisation Cloud Data Fusion à votre liste.
Afficher les journaux du pipeline
Vous pouvez afficher les journaux de pipeline à l'aide du tableau de bord Cloud Data Fusion Logging ou directement dans l'explorateur de journaux.
Afficher les journaux de pipeline à l'aide du tableau de bord
Si ce n'est pas déjà fait, importez le tableau de bord Cloud Data Fusion Logging.
Dans la section Mes tableaux de bord, cliquez sur Journalisation Cloud Data Fusion.
Dans la section Journaux du pipeline, consultez la liste des journaux du pipeline. Vous pouvez filtrer les journaux par niveau de gravité, noms de champs et valeurs.
Pour affiner votre recherche à l'aide de requêtes, utilisez l'explorateur de journaux.
Afficher les journaux de pipeline dans l'explorateur de journaux
Dans la console Google Cloud , accédez à la page Explorateur de journaux.
Saisissez la requête suivante :
resource.type="datafusion.googleapis.com/PipelineV2"La liste des journaux de pipeline s'affiche. Vous pouvez utiliser des filtres pour affiner les résultats.
Filtrer les journaux de pipeline
Vous pouvez filtrer les journaux de pipeline par ID d'exécution, ID d'instance, ID de pipeline, emplacement, espace de noms ou libellés personnalisés.
Chaque exécution de pipeline Cloud Data Fusion se voit attribuer un RunID unique.
Après avoir déployé et exécuté votre pipeline, vous pouvez trouver son RunID et afficher les journaux de pipeline correspondants.
Pour filtrer les journaux de pipeline par RunID :
Dans la console Google Cloud , accédez à la page Explorateur de journaux.
Saisissez la requête suivante :
resource.type="datafusion.googleapis.com/PipelineV2" resource.labels.run_id=RUN_ID
Afficher les journaux du service
Vous pouvez afficher les journaux de service à l'aide du tableau de bord Cloud Data Fusion Logging ou dans l'explorateur de journaux.
Afficher les journaux de service à l'aide du tableau de bord
Si ce n'est pas déjà fait, importez le tableau de bord Cloud Data Fusion Logging.
Dans la section Mes tableaux de bord, cliquez sur Journalisation Cloud Data Fusion.
Dans la section Journaux de service, consultez la liste des journaux de service. Vous pouvez filtrer les journaux par niveau de gravité, noms de champs et valeurs.
Pour affiner votre recherche à l'aide de requêtes, utilisez l'explorateur de journaux.
Afficher les journaux de service dans l'explorateur de journaux
À partir de la version 6.11.1.1 de Cloud Data Fusion, les journaux de service système utilisent par défaut la ressource surveillée InstanceV3 (datafusion.googleapis.com/InstanceV3). Ces journaux utilisent le suffixe de nom de journal services-v3 et n'incluent pas les libellés org_id ou namespace présents dans la version précédente. Bien que l'émission de journaux InstanceV2 soit désactivée par défaut pour les instances nouvelles et mises à niveau, vous pouvez réactiver la journalisation InstanceV2 à l'aide de l'API REST Cloud Data Fusion si vos opérations reposent sur les libellés anciens.
Pour afficher les journaux de service dans l'explorateur de journaux, procédez comme suit :
Dans la console Google Cloud , accédez à la page Explorateur de journaux.
Recherchez les journaux de service en saisissant la requête spécifique à ce service.
Nom du service Requête de journal pour InstanceV2 Requête de journal pour InstanceV3 Appfabric resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="appfabric"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="appfabric"
Processeur AppFabric resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="appfabric.processor"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="appfabric.processor"
Dataset Executor resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="dataset.executor"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="dataset.executor"
Économiseur de journaux resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="log.saver"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="log.saver"
Service de métadonnées resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="metadata.service"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="metadata.service"
Métriques resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="metrics"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="metrics"
Pipeline Studio resource.type="datafusion.googleapis.com/InstanceV2" resource.labels.namespace="system" labels.".userserviceid"="studio"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".userserviceid"="studio"
Environnement d'exécution resource.type="datafusion.googleapis.com/InstanceV2" labels.".serviceId"="runtime"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".serviceId"="runtime"
Service Wrangler resource.type="datafusion.googleapis.com/InstanceV2" resource.labels.namespace="system" labels.".applicationId"="dataprep" labels.".userserviceid"="service"
resource.type="datafusion.googleapis.com/InstanceV3" labels.".applicationId"="dataprep" labels.".userserviceid"="service"
Activer les journaux InstanceV2
Par défaut, les instances Cloud Data Fusion exécutant la version 6.11.1.1 ou ultérieure désactivent la journalisation InstanceV2. Si vos opérations nécessitent l'ancien format de journalisation (par exemple, si vous vous appuyez sur les libellés org_id ou namespace), vous pouvez réactiver les journaux InstanceV2 à l'aide de l'API REST Cloud Data Fusion.
Pour activer les journaux InstanceV2, utilisez la méthode instances.patch avec enable_instance_v2_logs défini sur true. Ce paramètre émet des journaux InstanceV2 et InstanceV3.
curl -X PATCH \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-H "X-GFE-SSL: yes" \
-H "Host: datafusion.googleapis.com" \
-d '{"loggingConfig": {"enable_instance_v2_logs": true}}' \
"https://datafusion.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances/INSTANCE_ID?updateMask=loggingConfig"
Remplacez les éléments suivants :
PROJECT_ID: ID du projet Google CloudLOCATION: emplacement de votre instanceINSTANCE_ID: ID de votre instance Cloud Data Fusion
Journalisation configurable dans Cloud Data Fusion
Cloud Data Fusion 6.11.0 propose une journalisation configurable, avec Cloud Logging activé par défaut. Bien qu'il soit possible de désactiver Cloud Logging, nous vous recommandons vivement de le laisser activé pour vous assurer d'avoir accès aux journaux critiques des pipelines et des instances.
Pour désactiver Cloud Logging, exécutez la commande suivante :
echo '{ "loggingConfig": {"instance_cloud_logging_disabled": "true"}}' | curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
--data @- \
"https://datafusion.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=$INSTANCE_ID?updateMask=logging_config"
Remplacez les éléments suivants :
PROJECT_ID: ID du projet Google CloudLOCATION: emplacement de votre instance.INSTANCE_ID: ID de votre instance Cloud Data Fusion
Étapes suivantes
- En savoir plus sur la journalisation des audits Cloud Data Fusion
- Découvrez comment afficher les journaux de pipeline avancés.