Managed Airflow (terza generazione) | Managed Airflow (seconda generazione) | Managed Airflow (prima generazione legacy)
Questa pagina descrive come raggruppare le attività nelle pipeline Airflow utilizzando i seguenti pattern di progettazione:
- Raggruppamento delle attività nel grafico DAG.
- Attivazione dei DAG secondari da un DAG principale.
- Raggruppamento delle attività con l'operatore
TaskGroup.
Raggruppare le attività nel grafico DAG
Per raggruppare le attività in determinate fasi della pipeline, puoi utilizzare le relazioni tra le attività nel file DAG.
Considera il seguente esempio:
In questo flusso di lavoro, le attività op-1 e op-2 vengono eseguite insieme dopo l'attività iniziale start. Puoi ottenere questo risultato raggruppando le attività con l'istruzione
start >> [task_1, task_2].
L'esempio seguente fornisce un'implementazione completa di questo DAG:
Attivare i DAG secondari da un DAG principale
Puoi attivare un DAG da un altro DAG con l'
TriggerDagRunOperator operatore.
Considera il seguente esempio:
In questo flusso di lavoro, i blocchi dag_1 e dag_2 rappresentano una serie di attività raggruppate in un DAG separato nell'ambiente Airflow gestito.
L'implementazione di questo flusso di lavoro richiede due file DAG separati. Il file DAG di controllo ha il seguente aspetto:
L'implementazione del DAG secondario, attivato dal DAG di controllo, ha il seguente aspetto:
Per il corretto funzionamento del DAG, devi caricare entrambi i file DAG nell'ambiente Airflow gestito.
Raggruppare le attività con l'operatore TaskGroup
Puoi utilizzare l'
TaskGroupoperatore per raggruppare le attività
nel DAG. Le attività definite all'interno di un blocco TaskGroup fanno comunque parte del DAG principale.
Considera il seguente esempio:
Le attività op-1 e op-2 sono raggruppate in un blocco con ID taskgroup_1. Un'implementazione di questo flusso di lavoro ha il seguente aspetto: