APPROX_COUNT_DISTINCT
הפונקציה APPROX_COUNT_DISTINCT סופרת את המספר המשוער של פריטים ייחודיים בשדה.
תחביר
APPROX_COUNT_DISTINCT(X)
פרמטרים
-
field_expression– שדה או ביטוי שמכילים את הפריטים שרוצים לספור.
איך פועלת הפונקציה APPROX_COUNT_DISTINCT
הפונקציה APPROX_COUNT_DISTINCT מקבלת פרמטר אחד, שיכול להיות שם של מדד, מאפיין או ביטוי מכל סוג. APPROX_COUNT_DISTINCT מחזירה את המספר המשוער של פריטים ייחודיים בשדה או בביטוי הזה.
הפונקציה APPROX_COUNT_DISTINCT יעילה יותר מבחינת עיבוד שאילתות מאשר COUNT_DISTINCT, אבל היא מחזירה תוצאות פחות מדויקות. אם מערך הנתונים שלכם גדול מאוד, או אם הביצועים של הדוח חשובים יותר מהספירות המדויקות, כדאי להשתמש בשיטה APPROX_COUNT_DISTINCT. שימוש ב-APPROX_COUNT_DISTINCT במקום ב-COUNT_DISTINCT יכול גם לעזור להפחית את עלויות השאילתות כשמשתמשים במקורות נתונים של BigQuery.
הסבר מפורט על אופן הפעולה של צבירה משוערת זמין במאמרי העזרה של BigQuery.
דוגמה
APPROX_COUNT_DISTINCT(Page)– סופרת את המספר המשוער של ערכים ייחודיים במאפיין Page.
המגבלות של APPROX_COUNT_DISTINCT
הפונקציה
APPROX_COUNT_DISTINCTזמינה רק כשמשתמשים בה עם מקורות נתונים של BigQuery.במקורות נתונים שלא תומכים ב-
APPROX_COUNT_DISTINCT, APPROX_COUNT_DISTINCTיפעל כמוCOUNT_DISTINCT.אי אפשר להחיל את הפונקציה הזו על מדד לפני צבירת הנתונים ( סוג צבירה של אוטומטי), או על ביטוי שהוא התוצאה של פונקציית צבירה אחרת. לדוגמה, נוסחה כמו
APPROX_COUNT_DISTINCT(Sessions)במקור נתונים של Google Analytics תפיק שגיאה.