La fonction COUNT_DISTINCT compte le nombre d'éléments uniques dans un champ.
Syntaxe
COUNT_DISTINCT(X)
Paramètres
X: champ ou expression contenant les éléments à comptabiliser.
Fonctionnement de la fonction COUNT_DISTINCT
La fonction COUNT_DISTINCT utilise un seul paramètre qui peut être le nom d'une dimension ou d'une expression qui n'entraîne pas d'agrégation. COUNT_DISTINCT renvoie le nombre total d'éléments uniques dans ce champ ou cette expression.
Pour compter tous les éléments, y compris les doublons, utilisez COUNT.
Exemples
| Example formula | Output |
|---|---|
COUNT_DISTINCT(user_id) |
22 854 921 |
COUNT_DISTINCT(order_id) |
497 091 812 |
Limites de COUNT_DISTINCT
Lorsque vous utilisez la fonction COUNT_DISTINCT, tenez compte des points suivants :
COUNT_DISTINCT fonctionne avec des données non agrégées
Vous ne pouvez pas appliquer cette fonction à des métriques, y compris à des champs dont le type d'agrégation est Automatique, ni à une expression issue d'une autre fonction d'agrégation. Par exemple, dans une source de données Google Analytics, une formule du type COUNT_DISTINCT(Sessions) génère une erreur, car Sessions est un champ agrégé Automatique.
Envisagez d'utiliser APPROX_COUNT_DISTINCT pour les données BigQuery
Pour éviter des coûts de requête plus élevés lors de l'utilisation de sources de données BigQuery, envisagez d'utiliser APPROX_COUNT_DISTINCT.
Résultats variables dus au pushdown de fonction
Pour optimiser les performances, Data Studio tente de déléguer (ou de "transférer") le calcul de COUNT_DISTINCT à la source de données sous-jacente chaque fois que cela est possible. Étant donné que le nombre réel est calculé par le système connecté plutôt que par Data Studio, les résultats peuvent varier en fonction de la manière dont ce système implémente le comptage distinct.
Par exemple, les facteurs suivants peuvent entraîner des différences dans les nombres distincts :
- Bases de données SQL : différents dialectes SQL peuvent gérer la sensibilité à la casse, la comparaison des espaces de fin ou le comptage des valeurs nulles de manière unique.
- Sources basées sur des fichiers : pour les connecteurs de fichiers (tels que les fichiers CSV), les résultats dépendent du comportement d'analyse du site cible et des opérations internes du moteur.
- API SaaS : les services cloud et les connecteurs SaaS sont limités par les fonctionnalités de leur API, qui peuvent renvoyer des nombres approximatifs ou appliquer une logique de filtrage spécifique.