שילוב עם Google Analytics 4
בדף הזה מתוארות ההגדרות הנדרשות כדי להעביר נתונים מ-Google Analytics 4 (GA4) כמקור נתונים של עומס העבודה השיווקי של Cortex Framework Data Foundation.
GA4 היא הגרסה העדכנית של Google Analytics. הוא מספק תמונה מלאה של התנהגות המשתמשים, ומתמקד במעקב מבוסס-אירועים ובלמידת מכונה כדי להציע תובנות מעמיקות יותר. המסגרת של Cortex מאפשרת לכם לחלץ נתונים מ-GA4 ולשלב אותם ב-BigQuery לצורך ניתוח ודיווח נוספים. תוכלו לקבל תובנות חשובות ולשפר את התוצאות העסקיות.
בתרשים הבא מתואר איך נתוני GA4 זמינים דרך עומס העבודה השיווקי של Cortex Framework Data Foundation:

קובץ תצורה
קובץ config.json
מגדיר את ההגדרות שנדרשות כדי להתחבר למקורות נתונים להעברת נתונים
ממגוון עומסי עבודה. הקובץ הזה מכיל את הפרמטרים הבאים של GA4:
"marketing": {
"deployGA4": true,
"GA4": {
"datasets": {
"cdc": [
{"property_id": 0, "name": ""}
],
"reporting": "REPORTING_GA4"
}
}
}
בטבלה הבאה מתואר הערך של כל פרמטר שיווקי:
| פרמטר | משמעות | ערך ברירת המחדל | תיאור |
marketing.deployGA4
|
פריסת GA4 | true
|
מריצים את הפריסה של מקור הנתונים ב-GA4. |
marketing.GA4.datasets.cdc
|
מערכי נתונים של BigQuery Export ל-GA4 | [{"property_id": 0, "name": ""}]
|
מערך של מערכי נתונים של Google Analytics 4 BigQuery
Export. כל רכיב מציין את Property ID בתור INT, וגם את השם של מערך הנתונים המתאים ב-BigQuery Export.
|
marketing.GA4.datasets.reporting
|
מערך נתונים לדיווח ב-GA4 | REPORTING_GA4
|
מערך נתונים לדיווח ב-GA4. |
מודל נתונים
בקטע הזה מתואר מודל הנתונים של GA4 באמצעות דיאגרמת קשרים בין ישויות (ERD).
תצוגות בסיסיות
אלה האובייקטים הכחולים ב-ERD, והם תצוגות בטבלאות CDC עם טרנספורמציות מינימליות לפירוק של מבני נתונים מורכבים. אפשר לראות תסריטים ב-src/marketing/src/GA4/src/reporting/ddls.
תצוגות של דוחות
אלה האובייקטים הירוקים ב-ERD, והם תצוגות דיווח שמכילות מדדים מצטברים. אפשר לראות תסריטים ב-src/marketing/src/GA4/src/reporting/ddls.
הגדרת שילוב עם GA4
ה-Cortex Framework Data Foundation משתלב עם GA4 על ידי יצירת שכבת דיווח על גבי מערכי הנתונים של BigQuery Export ב-GA4 (שמטופלים כמערכי נתונים של CDC בארכיטקטורה של Cortex Framework). הפעולה הזו מתבצעת על ידי יצירת תצוגות בזמן ריצה על גבי טבלאות CDC או על ידי הפעלת DAG של Managed Service for Apache Airflow לנתונים מגובשים בטבלאות BigQuery, בהתאם להגדרות הדיווח.
הגדרת BigQuery Export ב-GA4
ב-Cortex Framework נעשה שימוש בתכונה BigQuery Export של GA4 כדי לטעון נתונים ממערכת המקור אל BigQuery. פועלים לפי ההוראות להגדרת BigQuery Export או כל נכס GA4 במאמר העזרה הזה בנושא GA4: GA4 – הגדרת BigQuery Export.
בעיות ידועות, מגבלות ושיקולים נוספים
כשמגדירים את BigQuery Export ב-GA4, חשוב לשים לב לנקודות הבאות:
- מילוי חוסרים: ה-BigQuery Export של GA4 מתחיל ביום ההגדרה, ואין מילוי חוסרים.
- הבדלים בין המספרים שמוצגים בממשק המשתמש של GA4 לבין המספרים שמוצגים ב-Cortex Framework: יכול להיות שיהיו הבדלים קלים בין ממשק המשתמש של Google Analytics לבין Cortex Framework בגלל כמה גורמים, כולל, בין היתר, דגימה, עיכוב באיסוף הנתונים ודוחות עם עוצמה גבוהה. זו מגבלה ידועה וטבועה ב-Google Analytics. מידע נוסף זמין במאמר צמצום הפער בין ממשק המשתמש של Google Analytics לבין BigQuery Export .
- הגבלות על נפח הנתונים שמיוצאים: בהתאם למהדורת Google Analytics שבה אתם משתמשים, יכול להיות שתיתקלו בהגבלות שונות על נפח הנתונים שמיוצאים היומי ל-BigQuery. מידע נוסף זמין במאמר GA4 – הגדרת BigQuery Export.
- אזור זמן: ב-BigQuery Export,
event_dateמוגדר באזור הזמן לדיווח של הנכס, ואילוevent_timestampהוא חותמת הזמן ב-UTC במיקרו-שניות. לכן, אם משתמשים ב-event_timestamp, חשוב להתאים את אזור הזמן הנכון של הדוחות כשמשווים עם המספרים בממשק המשתמש. - ייצוא יומי לעומת ייצוא בסטרימינג (בזמן אמת) של אירועים: כשמייצאים אירועים, Cortex Framework תומך רק בטבלאות
events_YYYYMMDDשנוצרות על ידי ייצוא יומי מלא. מידע נוסף זמין במאמר GA4 – BigQuery Export. - הסכם רמת השירות (SLA) של GA4 360 ל-BigQuery Export:
מסגרת Cortex לא תומכת בטבלאות
events_fresh_שנוצרות על ידי עדכון יומי של הייצוא כטבלאות מקור נפרדות, אבל אפשר לפעול לפי הערות ההתאמה האישית ב-view של הדיווח ב-Eventsכדי להחליף את טבלאות המקור בטבלאות האלה, וכך ליהנות מהסכם רמת השירות שזמין במסגרת התכונה הזו.##CORTEX-CUSTOMERכל תצוגות הדוחות ימשיכו לפעול אחרי ההחלפה הזו.
עדכניות הנתונים והעיכובים
באופן כללי, רמת העדכניות של הנתונים במקורות הנתונים של Cortex Framework מוגבלת על ידי מה שמאפשר החיבור במעלה הזרם, וגם על ידי התדירות של הפעלת ה-DAG. כדאי להתאים את תדירות ההרצה של ה-DAG לתדירות של המקורות במעלה הזרם, למגבלות המשאבים ולצרכים העסקיים שלכם.
ב-Google Analytics 4, יכול להיות עיכוב של עד יום בנתוני BigQuery Export, בהתאם לאזור הזמן שלכם, אלא אם אתם משתמשים בעדכון יומי של הייצוא.
הגדרות אישיות
בקטע הזה מוסבר על ההגדרות של תהליך הנתונים.
חיבורים ל-Managed Service for Apache Airflow
יוצרים את החיבורים הבאים ב-Managed Airflow. פרטים נוספים זמינים במאמר בנושא ניהול חיבורים ב-Airflow.
| שם החיבור | מטרה |
dv360_cdc_bq
|
לגבי מערך נתונים גולמי > העברת מערך נתונים של CDC. |
dv360_reporting_bq
|
להעברה של מערך נתונים של CDC > מערך נתונים של דיווח. |
הגדרות דיווח
אתם יכולים להגדיר ולשלוט באופן שבו Cortex Framework יוצר נתונים לשכבת הדיווח הסופית ב-GA4 באמצעות קובץ הגדרות הדיווח src/GA4/config/reporting_settings.yaml. הקובץ הזה קובע איך נוצרים אובייקטים של BigQuery בשכבת הדיווח (טבלאות, תצוגות מפורטות,פונקציות או פרוצדורות מאוחסנות).
מידע נוסף זמין במאמר בנושא התאמה אישית של קובץ הגדרות הדיווח.
מה השלב הבא?
- מידע נוסף על מקורות נתונים ועומסי עבודה אחרים זמין במאמר מקורות נתונים ועומסי עבודה.
- מידע נוסף על השלבים לפריסה בסביבות ייצור זמין במאמר דרישות מוקדמות לפריסת Cortex Framework Data Foundation.
