Collecter les paramètres Managed Service pour Apache Airflow

Cette page explique comment collecter les paramètres Managed Service pour Apache Airflow afin d'automatiser les données dans Cortex Framework.

Si Managed Service pour Apache Airflow est disponible, vous devez créer des connexions dans Managed Service pour Apache Airflow qui pointent vers le projet source où se trouvent vos données, avec les noms suivants en fonction de la charge de travail à déployer. Pour en savoir plus sur les charges de travail, consultez Sources de données et charges de travail. Si vous créez des tables dans le calque de création de rapports, veillez à créer des connexions distinctes pour les DAG de création de rapports.

Déployer une charge de travail Créer pour Raw Créer pour les CDC Créer pour les rapports
SAP ND sap_cdc_bq sap_reporting_bq
SFDC sfdc_cdc_bq sfdc_cdc_bq sfdc_reporting_bq
Google Ads googleads_raw_dataflow googleads_cdc_bq googleads_reporting_bq
CM360 cm360_raw_dataflow cm360_cdc_bq cm360_reporting_bq
Meta meta_raw_dataflow meta_cdc_bq meta_reporting_bq
TikTok tiktok_raw_dataflow tiktok_cdc_bq tiktok_reporting_bq
LiveRamp ND liveramp_cdc_bq ND
SFMC sfmc_raw_dataflow sfmc_cdc_bq sfmc_reporting_bq
DV360 ND dv360_cdc_bq dv360_reporting_bq
GA4 ND ND ga4_reporting_bq
Oracle EBS ND ND oracleebs_reporting_bq
Développement durable ND ND k9_reporting_bq
Dimensions courantes ND ND k9_reporting

Conventions de nommage des connexions

Tenez compte des spécifications suivantes pour les conventions d'attribution de noms aux connexions :

  • Suffixes de connexion : les noms de connexion incluent des suffixes qui indiquent leur objectif :
    • _bq : utilisé pour accéder aux données BigQuery.
    • _dataflow : utilisé pour exécuter des tâches Dataflow.
  • Connexions aux données brutes : vous n'avez besoin de créer des connexions aux données brutes que si vous utilisez les modules d'ingestion de données fournis par Cortex.
  • Plusieurs sources de données : si vous déployez plusieurs sources de données (par exemple, SAP et Salesforce), nous vous recommandons de créer des connexions distinctes pour chacune d'elles, en supposant que des limites de sécurité sont appliquées aux comptes de service individuels. Vous pouvez également modifier le nom de la connexion dans le modèle avant le déploiement pour utiliser la même connexion pour écrire dans BigQuery.

Bonnes pratiques de sécurité

  • Évitez les connexions par défaut : nous vous déconseillons d'utiliser les connexions et les comptes de service par défaut proposés par Airflow, en particulier dans les environnements de production. Cela correspond au principe du moindre privilège, qui consiste à n'accorder que les autorisations d'accès minimales nécessaires.
  • Intégration de Secret Manager : si Secret Manager est activé pour Airflow, vous pouvez créer ces connexions dans Secret Manager en utilisant les mêmes noms. Les connexions stockées dans Secret Manager sont prioritaires par rapport à celles définies directement dans Airflow.