Managed Service for Apache Airflow の設定を収集する
このページでは、Cortex Framework 内のデータを自動化するために Managed Service for Apache Airflow の設定を収集する方法について説明します。
Managed Service for Apache Airflow が使用可能な場合は、ワークロードからデプロイまでの次の名前を使用して、データが存在するソース プロジェクトを指す 接続を作成する必要があります。ワークロードの詳細については、データソースとワークロードをご覧ください。レポート レイヤでテーブルを作成する場合は、レポート DAG 用に個別の接続を作成してください。
| ワークロードのデプロイ | Create for Raw | CDC 用に作成 | レポート用に作成 |
| SAP | なし | sap_cdc_bq
|
sap_reporting_bq
|
| SFDC | sfdc_cdc_bq
|
sfdc_cdc_bq
|
sfdc_reporting_bq
|
| Google 広告 | googleads_raw_dataflow
|
googleads_cdc_bq
|
googleads_reporting_bq
|
| CM360 | cm360_raw_dataflow
|
cm360_cdc_bq
|
cm360_reporting_bq
|
| Meta | meta_raw_dataflow
|
meta_cdc_bq
|
meta_reporting_bq
|
| TikTok | tiktok_raw_dataflow
|
tiktok_cdc_bq
|
tiktok_reporting_bq
|
| LiveRamp | なし | liveramp_cdc_bq
|
なし |
| SFMC | sfmc_raw_dataflow
|
sfmc_cdc_bq
|
sfmc_reporting_bq
|
| DV360 | なし | dv360_cdc_bq
|
dv360_reporting_bq
|
| GA4 | なし | なし | ga4_reporting_bq
|
| Oracle EBS | なし | なし | oracleebs_reporting_bq
|
| サステナビリティ | なし | なし | k9_reporting_bq
|
| 共通のディメンション | なし | なし | k9_reporting
|
接続の命名規則
接続の命名規則については、次の仕様を考慮してください。
- 接続の接尾辞: 接続名には、目的を示す接尾辞が含まれています。
_bq: BigQuery データへのアクセスに使用されます。_dataflow: Dataflow ジョブの実行に使用されます。
- 元データ接続: Cortex が提供するデータの取り込みモジュールを使用している場合にのみ、元データのデータ接続を作成する必要があります。
- 複数のデータソース: 複数のデータソース(SAP と Salesforce など)をデプロイする場合は、個々のサービス アカウントにセキュリティ制限が適用されていると仮定して、それぞれに個別の接続を作成することをおすすめします。または、デプロイ前にテンプレートで接続名を変更して、BigQuery への書き込みに同じ接続を使用することもできます。
おすすめのセキュリティ対策
- デフォルトの接続を避ける: Airflow が提供するデフォルトの接続とサービス アカウントは、特に本番環境では使用しないことをおすすめします。これは、必要な最小限のアクセス権のみを付与することを重視する最小権限の原則に沿ったものです。
- Secret Manager の統合: Airflow で Secret Manager が有効になっている場合は、同じ名前を使用して Secret Manager 内でこれらの接続を作成できます。Secret Manager に保存されている接続は、Airflow で直接定義されている接続よりも優先されます。