allow_approximate_optimization

Uso

view: view_name {
  measure: field_name {
    allow_approximate_optimization: yes 
  }
}
Jerarquía
allow_approximate_optimization
Tipos de campos posibles
Medir

Valor predeterminado
no

Acepta
Un valor booleano (sí o no)

Definición

En el caso de los dialectos que admiten bocetos de HyperLogLog, Looker puede aprovechar el algoritmo de HyperLogLog para aproximar los recuentos distintos de las tablas de agregación.

La instrucción allow_approximate_optimization: yes permite que Looker almacene bocetos de HyperLogLog en tablas de datos agregados, lo que significa que Looker puede usar aproximaciones para los recuentos distintos en el reconocimiento de agregaciones.

Consulta la sección Compatibilidad de dialectos con recuentos distintos y conocimiento de agregación en esta página para obtener la lista de dialectos que admiten recuentos distintos para tablas de agregación con bocetos de HyperLogLog.

En general, los recuentos de valores distintos no se pueden admitir con la función de reconocimiento de agregaciones, ya que no se pueden obtener datos precisos si se intenta agregar recuentos de valores distintos. Por ejemplo, si cuentas los usuarios distintos en un sitio web, es posible que haya un usuario que ingresó al sitio web dos veces, con tres semanas de diferencia. Si intentaras aplicar una tabla de agregación semanal para obtener un recuento mensual de usuarios distintos en tu sitio web, ese usuario se contaría dos veces en tu consulta de recuento mensual de usuarios distintos, y los datos serían incorrectos.

Una solución alternativa para esto es crear una tabla agregada que coincida exactamente con una consulta de Explore, como se describe en la página de documentación Aggregate awareness. Cuando la consulta de Explorar y la consulta de una tabla de datos agregados son iguales, las medidas de recuento de valores distintos proporcionan datos precisos, por lo que se pueden usar para la detección de datos agregados.

La otra opción es usar aproximaciones para los recuentos distintos. Se sabe que el algoritmo HyperLogLog tiene un potencial de error de alrededor del 2%. El parámetro allow_approximate_optimization requiere que tus desarrolladores de Looker confirmen que está bien usar datos aproximados para la medida, de modo que esta se pueda calcular de forma aproximada a partir de tablas agregadas.

Con el conocimiento agregado, hay dos casos en los que entran en juego los recuentos distintos:

  • El primer caso es con medidas de type: count_distinct.
  • El segundo caso se da con las medidas de type: count que Looker renderiza como tipos de medidas count_distinct. Como se explica en la página de documentación Reconocimiento de agregaciones, Looker renderiza las medidas count como count_distinct para evitar errores de cálculo de la expansión en Explorar que unen varias tablas de bases de datos.

En ambos casos, si tu dialecto admite bocetos de HyperLogLog, puedes agregar la instrucción allow_approximate_optimization: yes a las medidas para habilitar valores aproximados. Luego, puedes incluir estas medidas en las tablas de agregación.

Incluso para las medidas definidas con allow_approximate_optimization: yes, Looker devolverá datos exactos cuando sea posible. Por ejemplo, si las dimensiones de una consulta de Explorar coinciden perfectamente con las dimensiones de una tabla agregada, Looker puede proporcionar datos exactos para los recuentos de valores distintos, sin necesidad de aproximarlos. En este caso, verás en la pestaña SQL de Explorar que se usan medidas de recuento de valores distintos para el conocimiento agregado sin emplear el algoritmo de HyperLogLog.

Ejemplo

La medida apx_unique_count que se muestra en este ejemplo se establece para allow_approximate_optimization: yes, lo que significa que la medida se puede usar en un aggregate_table.

measure: apx_unique_count {
  type: count_distinct
    allow_approximate_optimization: yes   # default value is no
  sql: ${id} ;;
}

Compatibilidad con dialectos para recuentos distintos con reconocimiento de agregación

Looker puede usar recuentos distintos para la conciencia agregada con dialectos de bases de datos que admiten bocetos de HyperLogLog. En la versión más reciente de Looker, se admiten los siguientes dialectos de SQL para los recuentos de valores distintos con reconocimiento de agregaciones:

Dialecto ¿Es compatible?
Actian Avalanche
Amazon Athena
Amazon Aurora MySQL
Amazon Redshift
Amazon Redshift 2.1+
Amazon Redshift Serverless 2.1+
Apache Druid
Apache Druid 0.13+
Apache Druid 0.18+
Apache Hive 2.3+
Apache Hive 3.1.2+
Apache Spark 3+
ClickHouse
Cloudera Impala 3.1+
Cloudera Impala 3.1+ with Native Driver
Cloudera Impala with Native Driver
DataVirtuality
Databricks
Denodo 7
Denodo 8 & 9
Dremio
Dremio 11+
Exasol
Google BigQuery Legacy SQL
Google BigQuery Standard SQL
Google Cloud PostgreSQL
Google Cloud SQL
Google Spanner
Greenplum
HyperSQL
IBM Netezza
MariaDB
Microsoft Azure PostgreSQL
Microsoft Azure SQL Database
Microsoft Azure Synapse Analytics
Microsoft SQL Server 2008+
Microsoft SQL Server 2012+
Microsoft SQL Server 2016
Microsoft SQL Server 2017+
MongoBI
MySQL
MySQL 8.0.12+
Oracle
Oracle ADWC
PostgreSQL 9.5+
PostgreSQL pre-9.5
PrestoDB
PrestoSQL
SAP HANA
SAP HANA 2+
SingleStore
SingleStore 7+
Snowflake
Teradata
Trino
Vector
Vertica

Consulta la documentación de tu dialecto de SQL para comprender las ventajas y desventajas de este método en términos de velocidad y precisión.