שילוב עם Google Analytics 4

בדף הזה מתוארות ההגדרות הנדרשות כדי להעביר נתונים מ-Google Analytics 4‏ (GA4) כמקור נתונים של עומס העבודה השיווקי של Cortex Framework Data Foundation.

GA4 היא הגרסה העדכנית של Google Analytics. הוא מספק תמונה מלאה של התנהגות המשתמשים, ומתמקד במעקב מבוסס-אירועים ובלמידת מכונה כדי להציע תובנות מעמיקות יותר. המסגרת של Cortex מאפשרת לכם לחלץ נתונים מ-GA4 ולשלב אותם ב-BigQuery לצורך ניתוח ודיווח נוספים. תוכלו לקבל תובנות חשובות ולשפר את התוצאות העסקיות.

בתרשים הבא מתואר איך נתוני GA4 זמינים דרך עומס העבודה השיווקי של Cortex Framework Data Foundation:

מקור נתונים ב-GA4

איור 1. מקור נתונים ב-GA4.

קובץ תצורה

קובץ config.json מגדיר את ההגדרות שנדרשות כדי להתחבר למקורות נתונים להעברת נתונים ממגוון עומסי עבודה. הקובץ הזה מכיל את הפרמטרים הבאים של GA4:

   "marketing": {
        "deployGA4": true,
        "GA4": {
            "datasets": {
                "cdc": [
                    {"property_id": 0, "name": ""}
                ],
                "reporting": "REPORTING_GA4"
            }
        }
    }

בטבלה הבאה מתואר הערך של כל פרמטר שיווקי:

פרמטר משמעות ערך ברירת המחדל תיאור
marketing.deployGA4 פריסת GA4 true מריצים את הפריסה של מקור הנתונים ב-GA4.
marketing.GA4.datasets.cdc מערכי נתונים של BigQuery Export ל-GA4 [{"property_id": 0, "name": ""}] מערך של מערכי נתונים של Google Analytics 4 BigQuery Export. כל רכיב מציין את Property ID בתור INT, וגם את השם של מערך הנתונים המתאים ב-BigQuery Export.
marketing.GA4.datasets.reporting מערך נתונים לדיווח ב-GA4 REPORTING_GA4 מערך נתונים לדיווח ב-GA4.

מודל נתונים

בקטע הזה מתואר מודל הנתונים של GA4 באמצעות דיאגרמת קשרים בין ישויות (ERD).

תרשים קשרים בין ישויות ב-GA4

איור 2. ‫GA4: תרשים קשרים בין ישויות.

תצוגות בסיסיות

אלה האובייקטים הכחולים ב-ERD, והם תצוגות בטבלאות CDC עם טרנספורמציות מינימליות לפירוק של מבני נתונים מורכבים. אפשר לראות תסריטים ב-src/marketing/src/GA4/src/reporting/ddls.

תצוגות של דוחות

אלה האובייקטים הירוקים ב-ERD, והם תצוגות דיווח שמכילות מדדים מצטברים. אפשר לראות תסריטים ב-src/marketing/src/GA4/src/reporting/ddls.

הגדרת שילוב עם GA4

ה-Cortex Framework Data Foundation משתלב עם GA4 על ידי יצירת שכבת דיווח על גבי מערכי הנתונים של BigQuery Export ב-GA4 (שמטופלים כמערכי נתונים של CDC בארכיטקטורה של Cortex Framework). הפעולה הזו מתבצעת על ידי יצירת תצוגות בזמן ריצה על גבי טבלאות CDC או על ידי הפעלת DAG של Managed Service for Apache Airflow לנתונים מגובשים בטבלאות BigQuery, בהתאם להגדרות הדיווח.

הגדרת BigQuery Export ב-GA4

ב-Cortex Framework נעשה שימוש בתכונה BigQuery Export של GA4 כדי לטעון נתונים ממערכת המקור אל BigQuery. פועלים לפי ההוראות להגדרת BigQuery Export או כל נכס GA4 במאמר העזרה הזה בנושא GA4: GA4 – הגדרת BigQuery Export.

בעיות ידועות, מגבלות ושיקולים נוספים

כשמגדירים את BigQuery Export ב-GA4, חשוב לשים לב לנקודות הבאות:

  • מילוי חוסרים: ה-BigQuery Export של GA4 מתחיל ביום ההגדרה, ואין מילוי חוסרים.
  • הבדלים בין המספרים שמוצגים בממשק המשתמש של GA4 לבין המספרים שמוצגים ב-Cortex Framework: יכול להיות שיהיו הבדלים קלים בין ממשק המשתמש של Google Analytics לבין Cortex Framework בגלל כמה גורמים, כולל, בין היתר, דגימה, עיכוב באיסוף הנתונים ודוחות עם עוצמה גבוהה. זו מגבלה ידועה וטבועה ב-Google Analytics. מידע נוסף זמין במאמר צמצום הפער בין ממשק המשתמש של Google Analytics לבין BigQuery Export .
  • הגבלות על נפח הנתונים שמיוצאים: בהתאם למהדורת Google Analytics שבה אתם משתמשים, יכול להיות שתיתקלו בהגבלות שונות על נפח הנתונים שמיוצאים היומי ל-BigQuery. מידע נוסף זמין במאמר GA4 – הגדרת BigQuery Export.
  • אזור זמן: ב-BigQuery Export,‏ event_date מוגדר באזור הזמן לדיווח של הנכס, ואילו event_timestamp הוא חותמת הזמן ב-UTC במיקרו-שניות. לכן, אם משתמשים ב-event_timestamp, חשוב להתאים את אזור הזמן הנכון של הדוחות כשמשווים עם המספרים בממשק המשתמש.
  • ייצוא יומי לעומת ייצוא בסטרימינג (בזמן אמת) של אירועים: כשמייצאים אירועים, Cortex Framework תומך רק בטבלאות events_YYYYMMDD שנוצרות על ידי ייצוא יומי מלא. מידע נוסף זמין במאמר GA4 – BigQuery Export.
  • הסכם רמת השירות (SLA) של GA4 360 ל-BigQuery Export: מסגרת Cortex לא תומכת בטבלאות events_fresh_ שנוצרות על ידי עדכון יומי של הייצוא כטבלאות מקור נפרדות, אבל אפשר לפעול לפי הערות ההתאמה האישית ב-view של הדיווח ב-Events כדי להחליף את טבלאות המקור בטבלאות האלה, וכך ליהנות מהסכם רמת השירות שזמין במסגרת התכונה הזו.##CORTEX-CUSTOMER כל תצוגות הדוחות ימשיכו לפעול אחרי ההחלפה הזו.

עדכניות הנתונים והעיכובים

באופן כללי, רמת העדכניות של הנתונים במקורות הנתונים של Cortex Framework מוגבלת על ידי מה שמאפשר החיבור במעלה הזרם, וגם על ידי התדירות של הפעלת ה-DAG. כדאי להתאים את תדירות ההרצה של ה-DAG לתדירות של המקורות במעלה הזרם, למגבלות המשאבים ולצרכים העסקיים שלכם.

ב-Google Analytics 4, יכול להיות עיכוב של עד יום בנתוני BigQuery Export, בהתאם לאזור הזמן שלכם, אלא אם אתם משתמשים בעדכון יומי של הייצוא.

הגדרות אישיות

בקטע הזה מוסבר על ההגדרות של תהליך הנתונים.

חיבורים ל-Managed Service for Apache Airflow

יוצרים את החיבורים הבאים ב-Managed Airflow. פרטים נוספים זמינים במאמר בנושא ניהול חיבורים ב-Airflow.

שם החיבור מטרה
dv360_cdc_bq לגבי מערך נתונים גולמי > העברת מערך נתונים של CDC.
dv360_reporting_bq להעברה של מערך נתונים של CDC > מערך נתונים של דיווח.

הגדרות דיווח

אתם יכולים להגדיר ולשלוט באופן שבו Cortex Framework יוצר נתונים לשכבת הדיווח הסופית ב-GA4 באמצעות קובץ הגדרות הדיווח src/GA4/config/reporting_settings.yaml. הקובץ הזה קובע איך נוצרים אובייקטים של BigQuery בשכבת הדיווח (טבלאות, תצוגות מפורטות,פונקציות או פרוצדורות מאוחסנות).

מידע נוסף זמין במאמר בנושא התאמה אישית של קובץ הגדרות הדיווח.

מה השלב הבא?