הפונקציה COUNT_DISTINCT סופרת את מספר הפריטים הייחודיים בשדה.
תחביר
COUNT_DISTINCT(X)
פרמטרים
-
X– שדה או ביטוי שמכילים את הפריטים שרוצים לספור.
איך פועלת הפונקציה COUNT_DISTINCT
הפונקציה COUNT_DISTINCT מקבלת פרמטר אחד, שיכול להיות שם של מאפיין או ביטוי שלא מוביל לצבירה. COUNT_DISTINCT מחזירה את המספר הכולל של פריטים ייחודיים בשדה או בביטוי הזה.
כדי לספור את כל הפריטים, כולל כפילויות, משתמשים בפונקציה COUNT.
דוגמאות
| Example formula | Output |
|---|---|
COUNT_DISTINCT(user_id) |
22,854,921 |
COUNT_DISTINCT(order_id) |
497,091,812 |
המגבלות של COUNT_DISTINCT
כשמשתמשים בפונקציה COUNT_DISTINCT, חשוב לשים לב לדברים הבאים:
COUNT_DISTINCT פועל עם נתונים לא מצטברים
אי אפשר להחיל את הפונקציה הזו על מדדים, כולל שדות עם סוג Aggregation של Auto, או על ביטוי שהוא התוצאה של פונקציית צבירה אחרת. לדוגמה, נוסחה כמו COUNT_DISTINCT(Sessions) במקור נתונים של Google Analytics יוצרת שגיאה כי Sessions הוא שדה מצטבר מסוג אוטומטי.
כדאי להשתמש ב-APPROX_COUNT_DISTINCT לנתונים ב-BigQuery
כדי להימנע מעלויות גבוהות יותר של שאילתות כשמשתמשים במקורות נתונים של BigQuery, כדאי להשתמש ב-APPROX_COUNT_DISTINCT.
תוצאות משתנות מתוך העברת פונקציות למטה
כדי לשפר את הביצועים, מערכת Data Studio מנסה להעביר (או "לדחוף") את החישוב של COUNT_DISTINCT למקור הנתונים הבסיסי בכל הזדמנות. הספירה בפועל מתבצעת על ידי המערכת המקושרת ולא על ידי Data Studio, ולכן התוצאות עשויות להיות שונות בהתאם לאופן שבו המערכת הזו מיישמת ספירה של ערכים ייחודיים.
לדוגמה, הגורמים הבאים יכולים להוביל להבדלים בספירות של ערכים ייחודיים:
- מסדי נתונים של SQL: דיאלקטים שונים של SQL עשויים לטפל ברגישות לאותיות רישיות, בהשוואה של רווחים בסוף או בספירה של ערכי null בדרכים ייחודיות.
- מקורות מבוססי-קבצים: כשמדובר במחברים של קבצים (כמו קובצי CSV), התוצאות תלויות בהתנהגות הניתוח של אתר היעד ובפעולות פנימיות של המנוע.
- ממשקי API של SaaS: שירותי ענן ומחברים של SaaS מוגבלים על ידי יכולות ה-API שלהם, ולכן יכול להיות שהם יחזירו מספרים משוערים או יחילו לוגיקה ספציפית של סינון.