Pianificare i DAG di Airflow

Questo documento descrive come pianificare i grafici aciclici diretti (DAG) di Airflow da Managed Airflow 3 nella pagina Pianificazione di BigQuery, incluso come attivare manualmente i DAG e come visualizzare la cronologia e i log delle esecuzioni precedenti dei DAG.

Informazioni sulla gestione dei DAG di Airflow in BigQuery

La pagina Pianificazione in BigQuery fornisce strumenti per pianificare i DAG Airflow eseguiti negli ambienti Managed Airflow 3.

I DAG Airflow che pianifichi in BigQuery vengono eseguiti in uno o più ambienti Managed Airflow nel tuo progetto. La pagina Pianificazione in BigQuery combina le informazioni di tutti i DAG Airflow nel tuo progetto.

Durante l'esecuzione di un DAG, Airflow pianifica ed esegue le singole attività che compongono un DAG in una sequenza definita dal DAG. Nella pagina Pianificazione di BigQuery, puoi visualizzare gli stati delle esecuzioni di DAG passate, esplorare i log dettagliati di tutte le esecuzioni di DAG e di tutte le attività di queste esecuzioni di DAG e visualizzare i dettagli sui DAG.

Per saperne di più sui concetti di base di Airflow, come DAG, esecuzioni di DAG, attività o operatori, consulta la pagina Concetti di base nella documentazione di Airflow.

Per scoprire di più sugli ambienti Managed Airflow, consulta la pagina Panoramica di Managed Airflow 3 nella documentazione di Managed Airflow.

Prima di iniziare

  1. Abilitare l'API Cloud Composer.

    Ruoli richiesti per abilitare le API

    Per abilitare le API, devi disporre del ruolo IAM Amministratore utilizzo dei servizi (roles/serviceusage.serviceUsageAdmin), che include l'autorizzazione serviceusage.services.enable. Scopri come concedere i ruoli.

    Abilitare l'API

  2. Assicurati che il tuo progetto Google Cloud abbia almeno un ambiente Managed Airflow 3 con almeno un file DAG già caricato:

Autorizzazioni obbligatorie

Per ottenere le autorizzazioni necessarie per pianificare i DAG di Airflow, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questi ruoli predefiniti contengono le autorizzazioni necessarie per pianificare i DAG di Airflow. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per pianificare i DAG di Airflow sono necessarie le seguenti autorizzazioni:

  • Per visualizzare i DAG di Airflow e i relativi dettagli: composers.dags.list, composer.environments.list
  • Per attivare e mettere in pausa i DAG Airflow: composers.dags.list, composer.environments.list, composer.dags.execute

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Per saperne di più su IAM di Managed Airflow 3, consulta Controllo dell'accesso con IAM nella documentazione di Managed Airflow.

Attivare manualmente un DAG Airflow

Quando attivi manualmente un DAG Airflow, Airflow esegue il DAG una sola volta, indipendentemente dalla pianificazione specificata per il DAG.

Per attivare manualmente un DAG Airflow selezionato:

  1. Nella console Google Cloud , vai alla pagina Scheduling.

    Vai alla pagina Pianificazione

  2. Esegui una delle operazioni seguenti:

    • Fai clic sul nome del DAG selezionato, quindi nella pagina Dettagli DAG, fai clic su Attiva DAG.

    • Nella riga contenente il DAG selezionato, fai clic su Visualizza azioni nella colonna Azioni, quindi fai clic su Attiva DAG.

Visualizzare i log e i dettagli dell'esecuzione di DAG di Airflow

Per visualizzare i dettagli di un DAG Airflow selezionato:

  1. Nella console Google Cloud , vai alla pagina Scheduling.

    Vai alla pagina Pianificazione

  2. Fai clic sul nome del DAG selezionato.

  3. Nella pagina Dettagli DAG, seleziona la scheda Dettagli.

  4. Per visualizzare le esecuzioni DAG precedenti, seleziona la scheda Esecuzioni.

    1. (Facoltativo) La scheda Esecuzioni mostra le esecuzioni dei DAG degli ultimi 10 giorni per impostazione predefinita. Per filtrare le esecuzioni DAG in base a un intervallo di tempo diverso, nel menu a discesa 10 giorni, seleziona un intervallo di tempo e poi fai clic su Ok.

    2. (Facoltativo) Per visualizzare colonne aggiuntive con i dettagli dell'esecuzione del DAG nell'elenco di tutte le esecuzioni del DAG, fai clic su Opzioni di visualizzazione delle colonne, seleziona le colonne e fai clic su Ok.

    3. Per visualizzare i dettagli e i log di un'esecuzione DAG selezionata, seleziona un'esecuzione DAG.

  5. Per visualizzare una visualizzazione del DAG con le dipendenze delle attività, seleziona la scheda Diagramma.

    1. Per visualizzare i dettagli di un'attività, selezionala nel diagramma.
  6. Per visualizzare il codice sorgente del DAG, seleziona la scheda Codice.

  7. (Facoltativo) Per aggiornare i dati visualizzati, fai clic su Aggiorna.

Visualizza tutti i DAG di Airflow

Per visualizzare i DAG Airflow di tutti gli ambienti Managed Airflow 3 nel tuo progettoGoogle Cloud , segui questi passaggi:

  1. Nella console Google Cloud , vai alla pagina Scheduling.

    Vai alla pagina Pianificazione

  2. (Facoltativo) Per visualizzare colonne aggiuntive con i dettagli del DAG, fai clic su Opzioni di visualizzazione delle colonne, poi seleziona le colonne e fai clic su Ok.

Mettere in pausa un DAG Airflow

Per mettere in pausa un DAG Airflow selezionato:

  1. Nella console Google Cloud , vai alla pagina Scheduling.

    Vai alla pagina Pianificazione

  2. Esegui una delle operazioni seguenti:

    • Fai clic sul nome del DAG selezionato, quindi nella pagina Dettagli DAG, fai clic su Metti in pausa DAG.

    • Nella riga contenente il DAG selezionato, fai clic su Visualizza azioni nella colonna Azioni e poi fai clic su Metti in pausa DAG.

Risoluzione dei problemi

Per istruzioni sulla risoluzione dei problemi relativi ai DAG Airflow, vedi Risoluzione dei problemi relativi ai DAG Airflow nella documentazione di Managed Airflow.

Passaggi successivi