APPROX_COUNT_DISTINCT

הפונקציה APPROX_COUNT_DISTINCT סופרת את המספר המשוער של פריטים ייחודיים בשדה.

תחביר

APPROX_COUNT_DISTINCT(X)

פרמטרים

  • field_expression – שדה או ביטוי שמכילים את הפריטים שרוצים לספור.

איך פועלת הפונקציה APPROX_COUNT_DISTINCT

הפונקציה APPROX_COUNT_DISTINCT מקבלת פרמטר אחד, שיכול להיות שם של מדד, מאפיין או ביטוי מכל סוג. ‫APPROX_COUNT_DISTINCT מחזירה את המספר המשוער של פריטים ייחודיים בשדה או בביטוי הזה.

הפונקציה APPROX_COUNT_DISTINCT יעילה יותר מבחינת עיבוד שאילתות מאשר COUNT_DISTINCT, אבל היא מחזירה תוצאות פחות מדויקות. אם מערך הנתונים שלכם גדול מאוד, או אם הביצועים של הדוח חשובים יותר מהספירות המדויקות, כדאי להשתמש בשיטה APPROX_COUNT_DISTINCT. שימוש ב-APPROX_COUNT_DISTINCT במקום ב-COUNT_DISTINCT יכול גם לעזור להפחית את עלויות השאילתות כשמשתמשים במקורות נתונים של BigQuery.

הסבר מפורט על אופן הפעולה של צבירה משוערת זמין במאמרי העזרה של BigQuery.

דוגמה

APPROX_COUNT_DISTINCT(Page) – סופרת את המספר המשוער של ערכים ייחודיים במאפיין Page.

המגבלות של APPROX_COUNT_DISTINCT

  • הפונקציה APPROX_COUNT_DISTINCT זמינה רק כשמשתמשים בה עם מקורות נתונים של BigQuery.

  • במקורות נתונים שלא תומכים ב-APPROX_COUNT_DISTINCT, ‏ APPROX_COUNT_DISTINCT יפעל כמו COUNT_DISTINCT.

  • אי אפשר להחיל את הפונקציה הזו על מדד לפני צבירת הנתונים ( סוג צבירה של אוטומטי), או על ביטוי שהוא התוצאה של פונקציית צבירה אחרת. לדוגמה, נוסחה כמו APPROX_COUNT_DISTINCT(Sessions) במקור נתונים של Google Analytics תפיק שגיאה.