Planifier des exécutions en production

Ce guide de démarrage rapide vous explique comment planifier des exécutions en production dans Dataform :

Avant de commencer

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the BigQuery and Dataform APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  8. Sélectionnez ou créez également un compte de service personnalisé pour exécuter des workflows dans BigQuery.

    Rôles requis

    Pour obtenir les autorisations nécessaires pour effectuer toutes les tâches de ce tutoriel, demandez à votre administrateur de vous accorder les rôles IAM suivants :

    Pour en savoir plus sur l'attribution de rôles, consultez Gérer l'accès aux projets, aux dossiers et aux organisations.

    Vous pouvez également obtenir les autorisations requises avec des rôles personnalisés ou d'autres rôles prédéfinis.

    Attribuer les rôles requis

    Pour exécuter des workflows dans BigQuery, vous pouvez utiliser un compte de service personnalisé ou votre compte Google (aperçu). Toutefois, les identifiants de compte de service personnalisé sont l'option par défaut pour les exécutions planifiées. Il est déconseillé d'utiliser les identifiants de compte utilisateur Google pour les exécutions planifiées.

    Pour exécuter des workflows dans BigQuery, votre compte de service personnalisé doit disposer des rôles requis suivants :

    • Éditeur de données BigQuery (roles/bigquery.dataEditor) sur les projets auxquels Dataform doit avoir accès en lecture et en écriture. Il s'agit généralement du projet hébergeant votre dépôt Dataform.
    • Lecteur de données BigQuery (roles/bigquery.dataViewer) sur les projets auxquels Dataform doit avoir accès en lecture seule.
    • Utilisateur de job BigQuery (roles/bigquery.jobUser) sur le projet hébergeant votre dépôt Dataform.

    Pour permettre à Dataform d'utiliser votre compte de service personnalisé, l'agent de service Dataform par défaut doit disposer des rôles suivants sur la ressource de compte de service personnalisé :

    Pour attribuer ces rôles, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page IAM.

      Accéder à IAM

    2. Cliquez sur Accorder l'accès.

    3. Dans le champ Nouveaux comptes principaux, saisissez l'ID de votre compte de service personnalisé.

    4. Dans le menu Sélectionner un rôle, sélectionnez les rôles suivants un par un, en utilisant Ajouter un autre rôle pour chaque rôle supplémentaire :

      • Éditeur de données BigQuery
      • Lecteur de données BigQuery
      • Utilisateur de job BigQuery
    5. Cliquez sur Enregistrer.

    6. Dans la console Google Cloud , accédez à la page Comptes de service.

      Accéder à la page "Comptes de service"

    7. Sélectionnez votre compte de service personnalisé.

    8. Accédez à Comptes principaux avec accès, puis cliquez sur Accorder l'accès.

    9. Dans le champ Nouveaux comptes principaux, saisissez l'ID de votre agent de service Dataform par défaut.

      L'ID de votre agent de service Dataform par défaut se présente au format suivant :

      service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.com
      
    10. Dans la liste Sélectionner un rôle, ajoutez les rôles suivants :

      • Utilisateur du compte de service
      • Créateur de jetons du compte de service
    11. Cliquez sur Enregistrer.

    Créer un dépôt Dataform

    1. Dans la console Google Cloud , accédez à la page Dataform.

      Accéder à Dataform

    2. Cliquez sur Créer un dépôt.

    3. Sur la page CRÉER UN DÉPÔT, procédez comme suit :

      1. Dans le champ ID du dépôt, saisissez quickstart-production.

      2. Dans la liste Région, sélectionnez europe-west4.

      3. Dans le champ Compte de service, cliquez sur Saisir manuellement, puis saisissez le nom de votre compte de service personnalisé. Assurez-vous de saisir votre compte de service personnalisé dans ce champ.

      4. Cliquez sur Créer.

    4. Cliquez sur Accéder aux dépôts.

    Créer une configuration de version et une configuration de workflow

    Pour créer les résultats de la compilation en production du dépôt quickstart-production et planifier l'exécution des tables production, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Dataform.

      Accéder à Dataform

    2. Cliquez sur quickstart-production.

    3. Cliquez sur Versions et planification, puis sur Créer une version de production.

    4. Dans le volet Créer une configuration de version, configurez les paramètres suivants :

      1. Dans le champ ID de version, saisissez production.
      2. Dans le champ Commitish Git, conservez la valeur par défaut main .
      3. Dans la section Fréquence de programmation, dans le menu Répétitions, sélectionnez Personnalisée.
      4. Dans le champ Planification personnalisée, saisissez 0 16 * * *.
      5. Dans le menu Fuseau horaire, sélectionnez un fuseau horaire UTC+1. Par exemple, Heure normale d'Europe centrale (CET).

        Chaque jour à 16h UTC+1, Dataform compile le dépôt quickstart-production et applique les paramètres de compilation configurés dans cette configuration de version pour créer des résultats de compilation production.

    5. Cliquez sur Créer.

      La configuration de version production crée un résultat de compilation pour l'ensemble du dépôt quickstart-production tous les jours à 16h UTC+1.

    6. Assurez-vous d'être dans l'onglet Sorties et programmation. Accédez à la section Configurations de workflow, puis cliquez sur Créer.

    7. Dans le volet Create workflow configuration (Créer une configuration de workflow), configurez les paramètres suivants :

      1. Dans le champ ID de configuration, saisissez production.
      2. Dans le menu Configuration de version, sélectionnez production.
      3. Dans la section Fréquence de programmation, dans le menu Répétitions, sélectionnez Personnalisée.
      4. Dans le champ Planification personnalisée, saisissez 0 17 * * *.
      5. Dans le menu Fuseau horaire, sélectionnez un fuseau horaire UTC+1. Par exemple, Heure normale d'Europe centrale (CET).

        Chaque jour à 17h UTC+1, Dataform exécute le dernier résultat de compilation production du dépôt quickstart-production.

      6. Cliquez sur Toutes les actions.

        Dataform exécute toutes les actions du workflow dans le résultat de compilation production.

    8. Cliquez sur Créer.

      La configuration du workflow production exécute l'intégralité du résultat de compilation le plus récent créé par la configuration de version de production tous les jours à 17h UTC+1.

    Afficher les précédents résultats de compilation production

    Pour afficher les anciens résultats de la compilation production planifiée, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Dataform.

      Accéder à Dataform

    2. Sélectionnez le dépôt quickstart-production.

    3. Cliquez sur Sorties et programmation.

    4. Dans la section Configurations des versions, cliquez sur production.

    Afficher les exécutions de workflow production précédentes

    Pour afficher les exécutions de workflow production précédentes, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Dataform.

      Accéder à Dataform

    2. Sélectionnez le dépôt quickstart-production.

    3. Cliquez sur Journaux d'exécution de workflow.

    4. Sélectionnez une exécution de workflow pour afficher des informations plus détaillées, y compris l'état de chaque action et les journaux éventuels.

    Effectuer un nettoyage

    Pour éviter que les ressources utilisées dans cette démonstration soient facturées sur votre compte Google Cloud , procédez comme suit :

    Supprimer l'ensemble de données créé dans BigQuery

    Pour éviter que des frais ne vous soient facturés pour les éléments BigQuery, procédez comme suit afin de supprimer l'ensemble de données dataform_production :

    1. Dans la console Google Cloud , accédez à la page BigQuery.

      Accéder à BigQuery

    2. Dans le panneau Explorateur, développez votre projet et sélectionnez dataform_production.

    3. Cliquez sur le menu Actions, puis sélectionnez Supprimer.

    4. Dans la boîte de dialogue Supprimer l'ensemble de données, saisissez delete, puis cliquez sur Supprimer.

    Supprimer la configuration de version Dataform

    La création de configurations de version Dataform n'entraîne aucuns frais. Toutefois, si vous souhaitez supprimer la configuration de version production, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Dataform.

      Accéder à Dataform

    2. Cliquez sur quickstart-production.

    3. Cliquez sur Versions et programmation, puis accédez à la section Configurations des versions.

    4. À côté de la configuration de version production, cliquez sur le menu Plus, puis sur Supprimer.

    5. Dans la boîte de dialogue Supprimer la configuration de version, cliquez sur Supprimer.

    Supprimer la configuration de workflow Dataform

    Pour éviter que des frais liés aux éléments BigQuery ne vous soient facturés, procédez comme suit afin de supprimer la configuration de workflow Dataform production :

    1. Dans la console Google Cloud , accédez à la page Dataform.

      Accéder à Dataform

    2. Cliquez sur quickstart-production.

    3. Cliquez sur Versions et programmation, puis accédez à la section Configurations de workflow.

    4. À côté de la configuration de workflow production, cliquez sur le menu Plus, puis sur Supprimer.

    5. Dans la boîte de dialogue Supprimer la configuration de version, cliquez sur Supprimer.

    Supprimer le dépôt Dataform

    La création de dépôts Dataform n'entraîne aucuns frais. Toutefois, si vous souhaitez supprimer un dépôt et tout son contenu, procédez comme suit :

    1. Dans la console Google Cloud , accédez à la page Dataform.

      Accéder à Dataform

    2. À côté de quickstart-production, cliquez sur le menu Plus, puis sélectionnez Supprimer.

    3. Dans la fenêtre Supprimer le dépôt, saisissez le nom du dépôt pour confirmer la suppression.

    4. Pour confirmer l'opération, cliquez sur Supprimer.

    Étapes suivantes