איך מיזוגים פועלים ב-Data Studio

מיזוג נתונים מאפשר ליצור תרשימים, טבלאות ופקדים שמבוססים על כמה מקורות נתונים. אתם יכולים למזג נתונים מחמישה מקורות נתונים לכל היותר ב-Data Studio או בדוחות Looker.

לדוגמה, אתם יכולים למזג נתונים מטבלאות שונות ב-BigQuery – נניח פרטי לקוחות ופרטי הזמנות – ולהציג את המידע הזה בטבלה אחת ב-Data Studio. דוגמה נוספת: אפשר לשרטט נתונים משולבים מחשבונות Google Ads ו-Google Analytics בסדרת זמן כדי לראות תצוגה מאוחדת של ביצועים ברמת הקמפיין השיווקי.

ההבדלים בין מקורות נתונים לבין מקורות נתונים משולבים

מיזוג נתונים יוצר משאב שנקרא מיזוג. מיזוגים דומים למקורות נתונים, בכך שהם מספקים נתונים לתרשימים ולאמצעי בקרה בדוח. עם זאת, יש כמה הבדלים חשובים בין תערובות לבין מקורות נתונים:

  • המידע בנתונים המשולבים מגיע מכמה מקורות נתונים.
  • המיזוגים תמיד מוטמעים בדוח שבו הם נוצרו. אי אפשר להשתמש בתערובת שוב בדוחות אחרים. אבל אם מעתיקים את הדוח, המיזוגים מועתקים לדוח החדש, כך שהתרשימים ימשיכו לפעול על הנתונים הממוזגים.
  • מדדים במקור הנתונים הבסיסי הופכים למאפיינים מספריים לא מצטברים במיזוג. מידע נוסף מופיע בדף התיעוד בנושא טיפים למיזוג ומושגים מתקדמים.
  • ל-Blends אין הגדרות משלהם לגבי רעננות הנתונים או פרטי הכניסה. במקום זאת, ההגדרות האלה עוברות בירושה ממקורות הנתונים הבסיסיים.

איך תערובות עובדות

מתכנתים של מסדי נתונים משתמשים בהצהרות SQL join כדי למזג נתונים מטבלאות שונות. ב-Data Studio, אפשר למזג נתונים בלי לכתוב קוד. במקום זאת, משתמשים בכלי לעריכת מיזוג כדי להגדיר את הצירוף, כמו שמוצג בצילום המסך הבא:

בכלי לעריכת מיזוגים מוצגות אפשרויות מיזוג שמופיעות כשבוחרים אפשרויות של טבלה ושדה.

מקרא:

  1. Tables
  2. הגדרות הצטרפות
  3. הלחצן צירוף לטבלה אחרת
  4. שם השילוב
  5. מאפיינים ומדדים שכלולים
  6. הוספת מדדים, טווח תאריכים ומסננים
  7. האפשרות הסתרת שדות חוזרים של הצטרפות והלחצן שמירה

Tables

תערובות מורכבות מטבלאות. כשעורכים או יוצרים מיזוג, הטבלאות שלו מוצגות בממשק המשתמש. כל טבלה מכילה קבוצה של שדות שמחולצים ממקור הנתונים הבסיסי. אפשר לשלב עד חמש טבלאות.

לפני שמצטרפים לטבלאות, Data Studio מקבץ ומצטבר שורות בכל טבלה על סמך המאפיינים שנכללים באותה טבלה. אם המאפיינים שבוחרים לא כוללים מזהה ייחודי לכל רשומה, שורות זהות מכווצות במהלך שלב הטרום-קיבוץ הזה. הצמצום הזה יכול להוביל למספר שורות נמוך יותר ממה שאפשר לקבל מהרצת שאילתת SQL join ישירות על אותם נתונים. כדי למנוע את כיווץ השורות לפני הזמן, מוסיפים שדה מזהה ייחודי (כמו מפתח ראשי או מזהה שורה ייחודי) לרשימת המאפיינים של כל טבלה במיזוג.

כדי להוסיף נתונים לטבלה, לוחצים על הוספת מאפיין או על הוספת מדד.

השדות שמשמשים בתנאי הצטרפות מוצגים עם סמל קישור סמל הקישור משמש להצגת שדות בתנאי איחוד..

הגדרות הצטרפות

הגדרת הצטרפות מקשרת בין זוגות של טבלאות במיזוג. הגדרת הצטרפות מורכבת מאופרטור, שמגדיר איך לשלב רשומות תואמות ולא תואמות מהטבלאות האלה, ומתנאי, שהוא קבוצה של שדות שמגדירה את הקשר בין הטבלאות.

לדוגמה, בצילום המסך הבא, הטבלה Grades מצטרפת לטבלה Students בשדה student_id ולטבלה Classes בשדה class_id. שתי הגדרות ההצטרפות משתמשות באופרטור left outer.

הגדרת הצטרפות עם אופרטור Left outer Join שנבחר, ותנאי ההצטרפות מוגדרים בין השדות student_id (ציונים) ו-student_id (תלמידים).

אופרטורים של הצטרפות

אופרטור הצירוף קובע איך השורות התואמות והלא תואמות מהטבלאות במיזוג יצורפו יחד. ‫Data Studio תומך באופרטורים הבאים של צירוף:

  • Inner join: מחזירה רק שורות תואמות מהטבלאות השמאלית והימנית.
  • Left outer join: מחזירה שורות תואמות מהטבלה הימנית, בתוספת שורות לא תואמות מהטבלה השמאלית.
  • Right outer join: מחזירה שורות תואמות מהטבלאות השמאליות, בנוסף לשורות לא תואמות מהטבלה הימנית.
  • Full outer join: מחזירה את כל השורות התואמות מהטבלאות השמאליות או מהטבלה הימנית.
  • Cross join: מחזירה כל שילוב אפשרי של שורות מהטבלאות השמאלית והימנית.

מידע נוסף על אופרטורים של צירוף מופיע במסמכי BigQuery.

תנאי הצטרפות

תנאי איחוד הוא שדה או שדות שקיימים בכל טבלה ואפשר להשתמש בהם כדי לקשר בין הרשומות של הטבלאות האלה. לדוגמה, בתרשים שמשלב בין נתונים מ-Google Analytics ומ-Google Ads, אם השדה שם הקמפיין קיים בשתי הטבלאות שחולצו, Data Studio יכול להשתמש בשדה הזה כדי לאחד את הנתונים.

לכל טבלה במיזוג, בוחרים את השדות שבהם רוצים להשתמש בתנאי. שימו לב שלא חייבים להשתמש באותם שדות בכל טבלה, וגם לא חייבים להשתמש באותם שמות שדות, כל עוד הנתונים בכל שדה זהים. לדוגמה, נניח שאתם רוצים להציג באופן חזותי לקוחות, הזמנות ופריטים בתרשים אחד. הטבלאות האלה עשויות לכלול את השדות הבאים:

טבלת לקוחות

  • customer_ID
  • customer_name

טבלת הזמנות

  • cust_id
  • order_number
  • order_total

טבלת פריטים

  • order_number
  • SKU

כדי למזג את הטבלאות האלה, צריך לאחד את הטבלה Customers עם הטבלה Orders באמצעות השדות customer_ID ו-cust_id כתנאי לאיחוד, ולאחד את הטבלה Orders עם הטבלה Items באמצעות order_number כתנאי לאיחוד.

מאפיינים ומדדים שכלולים

כל שדה שמשמש בתנאי הצירוף של המיזוג, וכל מאפיין או מדד נוסף שמוסיפים למיזוג, מפורטים בקטע מאפיינים ומדדים כלולים. אלה השדות שתוכלו להשתמש בהם בכל תרשים שמבוסס על המיזוג.

הסתרה של שדות חוזרים של שאילתות איחוד (join)

האפשרות הסתרת שדות חוזרים של צירוף מחריגה שדות כפולים שמשמשים בתנאי צירוף. כדי לכלול שדות חוזרים של הצטרפות, מבטלים את הסימון של האפשרות הזו.

לדוגמה, נניח שאתם מצטרפים לשלוש טבלאות: Grades,‏ Students ו-Classes, באמצעות השדות student_id ו-class_id בהגדרת הצירוף. אם האפשרות הסתרת שדות חוזרים של הצטרפות מסומנת, המיזוג כולל רק מופע אחד של student_id ושל class_id.

שילוב של טבלאות הציונים, התלמידים והכיתות, כולל רק שדה student_id אחד ורק שדה class_id אחד.

באותה הגדרת מיזוג, אם האפשרות הסתרת שדות חוזרים של הצטרפות לא מסומנת, המיזוג כולל עכשיו כמה מופעים שלstudent_id ושל class_id, יחד עם שם הטבלה שבה השדה מופיע. לדוגמה: class_id (ציונים), class_id (כיתות), student_id (ציונים) ו-student_id (תלמידים).

שילוב של טבלאות הציונים, התלמידים והכיתות, כולל כמה שדות student_id וכמה שדות class_id.

טווח תאריכים ומסננים

כדי להגביל את הנתונים במיזוג, אפשר להחיל טווח תאריכים או מסנן על טבלה אחת או יותר.

דוגמה למיזוג

הדוגמה של מיזוג נתונים של כיתות, תלמידים וציונים מדגימה איך לפתור תרחיש שימוש קלאסי של מיזוג נתונים.