איסוף הגדרות של Managed Service for Apache Airflow
בדף הזה מוסבר איך לאסוף הגדרות של Managed Service for Apache Airflow כדי להפוך נתונים לאוטומטיים ב-Cortex Framework.
אם השירות המנוהל ל-Apache Airflow זמין, צריך ליצור חיבורים בשירות המנוהל ל-Apache Airflow שמפנים לפרויקט המקור שבו נמצאים הנתונים, עם השמות הבאים בהתאם לעומס העבודה לפריסה. פרטים על עומסי עבודה זמינים במאמר מקורות נתונים ועומסי עבודה. אם אתם יוצרים טבלאות בשכבת הדיווח, הקפידו ליצור חיבורים נפרדים ל-DAG של הדיווח.
| פריסת עומס עבודה | יצירה עבור Raw | יצירה עבור CDC | יצירה לצורך דיווח |
| SAP | לא רלוונטי | sap_cdc_bq
|
sap_reporting_bq
|
| SFDC | sfdc_cdc_bq
|
sfdc_cdc_bq
|
sfdc_reporting_bq
|
| Google Ads | googleads_raw_dataflow
|
googleads_cdc_bq
|
googleads_reporting_bq
|
| CM360 | cm360_raw_dataflow
|
cm360_cdc_bq
|
cm360_reporting_bq
|
| Meta | meta_raw_dataflow
|
meta_cdc_bq
|
meta_reporting_bq
|
| טיקטוק | tiktok_raw_dataflow
|
tiktok_cdc_bq
|
tiktok_reporting_bq
|
| LiveRamp | לא רלוונטי | liveramp_cdc_bq
|
לא רלוונטי |
| SFMC | sfmc_raw_dataflow
|
sfmc_cdc_bq
|
sfmc_reporting_bq
|
| DV360 | לא רלוונטי | dv360_cdc_bq
|
dv360_reporting_bq
|
| GA4 | לא רלוונטי | לא רלוונטי | ga4_reporting_bq
|
| Oracle EBS | לא רלוונטי | לא רלוונטי | oracleebs_reporting_bq
|
| קיימוּת | לא רלוונטי | לא רלוונטי | k9_reporting_bq
|
| מאפיינים נפוצים | לא רלוונטי | לא רלוונטי | k9_reporting
|
מוסכמות למתן שמות לחיבורים
כדאי להביא בחשבון את המפרטים הבאים לגבי מוסכמות למתן שמות לחיבורים:
- סיומות של חיבורים: שמות החיבורים כוללים סיומות שמציינות את המטרה שלהם:
-
_bq: משמש לגישה לנתונים ב-BigQuery. _dataflow: משמש להרצת משימות Dataflow.
-
- קישורים לנתונים גולמיים: צריך ליצור קישורים לנתונים גולמיים רק אם משתמשים במודולים להזנת נתונים שסופקו על ידי Cortex.
- כמה מקורות נתונים: אם אתם פורסים כמה מקורות נתונים (לדוגמה, SAP ו-Salesforce), מומלץ ליצור חיבורים נפרדים לכל אחד מהם, בהנחה שהגבלות אבטחה חלות על חשבונות שירות נפרדים. לחלופין, אפשר לשנות את שם החיבור בתבנית לפני הפריסה כדי להשתמש באותו חיבור לכתיבה ל-BigQuery.
שיטות מומלצות לאבטחה
- לא מומלץ להשתמש בחיבורים ובחשבונות שירות שמוגדרים כברירת מחדל ב-Airflow, במיוחד בסביבות ייצור. הגישה הזו תואמת לעיקרון ההרשאות המינימליות, שמדגיש את הצורך להעניק רק את הרשאות הגישה המינימליות הנדרשות.
- שילוב עם Secret Manager: אם הפעלתם את Secret Manager ב-Airflow, תוכלו ליצור את החיבורים האלה ב-Secret Manager באמצעות אותם שמות. לחיבורים שמאוחסנים ב-Secret Manager יש עדיפות על פני חיבורים שמוגדרים ישירות ב-Airflow.