Mit der COUNT_DISTINCT-Funktion wird die Anzahl der eindeutigen Elemente in einem Feld ermittelt.
Syntax
COUNT_DISTINCT(X)
Parameter
X: Ein Feld oder Ausdruck, das bzw. der die zu zählenden Elemente enthält.
Arbeitsweise der COUNT_DISTINCT-Funktion
Die COUNT_DISTINCT-Funktion verwendet einen Parameter. Das kann der Name einer Dimension oder ein Ausdruck sein, der nicht zu einer Zusammenfassung führt. COUNT_DISTINCT gibt die Gesamtzahl der eindeutigen Elemente in diesem Feld oder Ausdruck zurück.
Sollen alle Elemente einschließlich Duplikaten gezählt werden, verwenden Sie COUNT.
Beispiele
| Example formula | Output |
|---|---|
COUNT_DISTINCT(user_id) |
22.854.921 |
COUNT_DISTINCT(order_id) |
497.091.812 |
Einschränkungen von COUNT_DISTINCT
Beachten Sie bei der Verwendung der COUNT_DISTINCT-Funktion Folgendes:
COUNT_DISTINCT funktioniert mit nicht aggregierten Daten
Sie können diese Funktion nicht auf Messwerte anwenden, einschließlich Feldern mit dem Zusammenfassungstyp Auto, oder auf einen Ausdruck, der das Ergebnis einer anderen Zusammenfassungsfunktion ist. Beispielsweise führt eine Formel wie COUNT_DISTINCT(Sessions) in einer Google Analytics-Datenquelle zu einem Fehler, weil Sessions ein Feld mit der Aggregation Automatisch ist.
Verwenden Sie gegebenenfalls APPROX_COUNT_DISTINCT für BigQuery-Daten
Wenn Sie etwaige höhere Abfragekosten bei der Nutzung von BigQuery-Datenquellen vermeiden möchten, empfiehlt es sich, APPROX_COUNT_DISTINCT zu verwenden.
Variable Ergebnisse aus dem Pushdown von Funktionen
Um die Leistung zu optimieren, versucht Data Studio, die Berechnung von COUNT_DISTINCT nach Möglichkeit an die zugrunde liegende Datenquelle zu delegieren („push down“). Da die tatsächliche Zählung vom verbundenen System und nicht von Data Studio durchgeführt wird, können die Ergebnisse je nach Implementierung der individuellen Zählung durch das System variieren.
Faktoren, die zu Unterschieden bei den eindeutigen Zählungen führen können, sind beispielsweise:
- SQL-Datenbanken: Bei verschiedenen SQL-Dialekten kann die Groß-/Kleinschreibung, der Vergleich von nachgestellten Leerzeichen oder das Zählen von Nullwerten unterschiedlich gehandhabt werden.
- Dateibasierte Quellen: Bei Dateiconnectors (z. B. CSV-Dateien) hängen die Ergebnisse vom Parsing-Verhalten der Zielwebsite und den internen Vorgängen der Engine ab.
- SaaS-APIs: Cloud-Dienste und SaaS-Connectors sind durch ihre API-Funktionen eingeschränkt. Sie geben möglicherweise ungefähre Werte zurück oder wenden eine bestimmte Filterlogik an.