APPROX_COUNT_DISTINCT

APPROX_COUNT_DISTINCT 函数用于计算字段中唯一项的近似数量。

语法

APPROX_COUNT_DISTINCT(X)

参数

  • field_expression - 包含要计数的项的字段或表达式。

APPROX_COUNT_DISTINCT 函数的工作原理

APPROX_COUNT_DISTINCT 函数接受一个参数,该参数可以是指标、维度或任何类型的表达式的名称。APPROX_COUNT_DISTINCT 会返回该字段或表达式中唯一项的近似数量。

COUNT_DISTINCT 相比,APPROX_COUNT_DISTINCT 在查询处理方面更高效,但返回的结果不太准确。如果您的数据集非常大,或者报告的性能比准确计数更重要,请考虑使用 APPROX_COUNT_DISTINCT。使用 APPROX_COUNT_DISTINCT 而不是 COUNT_DISTINCT 还可以帮助降低使用 BigQuery 数据源时的查询费用。

如需详细了解近似聚合的工作原理,请参阅 BigQuery 文档

示例

APPROX_COUNT_DISTINCT(Page) - 计算网页 维度中唯一值的近似数量。

APPROX_COUNT_DISTINCT 的限制

  • APPROX_COUNT_DISTINCT 函数仅在与 BigQuery 数据源搭配使用时可用。

  • 对于不支持 APPROX_COUNT_DISTINCT 的数据源,APPROX_COUNT_DISTINCT 的行为将与 COUNT_DISTINCT 类似。

  • 您无法将此函数应用于预先聚合的指标(聚合 类型为自动 ),也无法应用于另一个聚合函数的结果表达式。例如,在 Google Analytics 数据源中使用 APPROX_COUNT_DISTINCT(Sessions) 等公式会产生错误。