APPROX_COUNT_DISTINCT
Mit der Funktion APPROX_COUNT_DISTINCT wird die ungefähre Anzahl eindeutiger Elemente in einem Feld ermittelt.
Syntax
APPROX_COUNT_DISTINCT(X)
Parameter
field_expression: ein Feld oder ein Ausdruck mit den Elementen, die gezählt werden sollen
Funktionsweise von APPROX_COUNT_DISTINCT
Für die Funktion APPROX_COUNT_DISTINCT wird ein Parameter verwendet. Das kann der Name eines Messwerts, einer Dimension oder eines Ausdrucks eines beliebigen Typs sein. APPROX_COUNT_DISTINCT gibt die ungefähre Anzahl der eindeutigen Elemente in diesem Feld oder Ausdruck zurück.
APPROX_COUNT_DISTINCT lässt sich effizienter verarbeiten als COUNT_DISTINCT, allerdings sind die Ergebnisse ungenauer. Es ist beispielsweise sinnvoll, APPROX_COUNT_DISTINCT statt `COUNT_DISTINCT` zu verwenden, wenn Ihr Datensatz sehr groß oder die Leistung des Berichts wichtiger als eine genaue Zählung ist. Dadurch lassen sich auch die Abfragekosten für BigQuery-Datenquellen senken.APPROX_COUNT_DISTINCTCOUNT_DISTINCT
Eine ausführliche Erläuterung zu ungefähren Zusammenfassungen finden Sie in der BigQuery-Dokumentation.
Beispiel
APPROX_COUNT_DISTINCT(Page): ermittelt die ungefähre Anzahl eindeutiger Werte in der Dimension Page.
Einschränkungen von APPROX_COUNT_DISTINCT
Die Funktion
APPROX_COUNT_DISTINCTkann nur mit BigQuery-Datenquellen verwendet werden.Bei Datenquellen, die
APPROX_COUNT_DISTINCTnicht unterstützen, verhält sichAPPROX_COUNT_DISTINCTwieCOUNT_DISTINCT.Sie können diese Funktion nicht auf einen bereits aggregierten Messwert ( mit Auto als Aggregationstyp ) oder einen Ausdruck anwenden, der das Ergebnis einer anderen Aggregationsfunktion ist. Eine Formel wie
APPROX_COUNT_DISTINCT(Sessions)in einer Google Analytics-Datenquelle wird beispielsweise einen Fehler auslösen.