Uso
view: view_name {
measure: field_name {
allow_approximate_optimization: yes
}
}
|
Jerarquía
allow_approximate_optimization |
Tipos de campos posibles
Medir
Valor predeterminado
no
Acepta
Un valor booleano (sí o no)
|
Definición
En el caso de los dialectos que admiten bocetos de HyperLogLog, Looker puede aprovechar el algoritmo de HyperLogLog para aproximar los recuentos distintos de las tablas de agregación.
La instrucción allow_approximate_optimization: yes permite que Looker almacene bocetos de HyperLogLog en tablas de datos agregados, lo que significa que Looker puede usar aproximaciones para los recuentos distintos en el reconocimiento de agregaciones.
Consulta la sección Compatibilidad de dialectos con recuentos distintos y conocimiento de agregación en esta página para obtener la lista de dialectos que admiten recuentos distintos para tablas de agregación con bocetos de HyperLogLog.
En general, los recuentos de valores distintos no se pueden admitir con la función de reconocimiento de agregaciones, ya que no se pueden obtener datos precisos si se intenta agregar recuentos de valores distintos. Por ejemplo, si cuentas los usuarios distintos en un sitio web, es posible que haya un usuario que ingresó al sitio web dos veces, con tres semanas de diferencia. Si intentaras aplicar una tabla de agregación semanal para obtener un recuento mensual de usuarios distintos en tu sitio web, ese usuario se contaría dos veces en tu consulta de recuento mensual de usuarios distintos, y los datos serían incorrectos.
Una solución alternativa para esto es crear una tabla agregada que coincida exactamente con una consulta de Explore, como se describe en la página de documentación Aggregate awareness. Cuando la consulta de Explorar y la consulta de una tabla de datos agregados son iguales, las medidas de recuento de valores distintos proporcionan datos precisos, por lo que se pueden usar para la detección de datos agregados.
La otra opción es usar aproximaciones para los recuentos distintos. Se sabe que el algoritmo HyperLogLog tiene un potencial de error de alrededor del 2%. El parámetro allow_approximate_optimization requiere que tus desarrolladores de Looker confirmen que está bien usar datos aproximados para la medida, de modo que esta se pueda calcular de forma aproximada a partir de tablas agregadas.
Con el conocimiento agregado, hay dos casos en los que entran en juego los recuentos distintos:
- El primer caso es con medidas de
type: count_distinct. - El segundo caso se da con las medidas de
type: countque Looker renderiza como tipos de medidascount_distinct. Como se explica en la página de documentación Reconocimiento de agregaciones, Looker renderiza las medidascountcomocount_distinctpara evitar errores de cálculo de la expansión en Explorar que unen varias tablas de bases de datos.
En ambos casos, si tu dialecto admite bocetos de HyperLogLog, puedes agregar la instrucción allow_approximate_optimization: yes a las medidas para habilitar valores aproximados. Luego, puedes incluir estas medidas en las tablas de agregación.
Incluso para las medidas definidas con
allow_approximate_optimization: yes, Looker devolverá datos exactos cuando sea posible. Por ejemplo, si las dimensiones de una consulta de Explorar coinciden perfectamente con las dimensiones de una tabla agregada, Looker puede proporcionar datos exactos para los recuentos de valores distintos, sin necesidad de aproximarlos. En este caso, verás en la pestaña SQL de Explorar que se usan medidas de recuento de valores distintos para el conocimiento agregado sin emplear el algoritmo de HyperLogLog.
Ejemplo
La medida apx_unique_count que se muestra en este ejemplo se establece para allow_approximate_optimization: yes, lo que significa que la medida se puede usar en un aggregate_table.
measure: apx_unique_count {
type: count_distinct
allow_approximate_optimization: yes # default value is no
sql: ${id} ;;
}
Compatibilidad con dialectos para recuentos distintos con reconocimiento de agregación
Looker puede usar recuentos distintos para la conciencia agregada con dialectos de bases de datos que admiten bocetos de HyperLogLog. En la versión más reciente de Looker, se admiten los siguientes dialectos de SQL para los recuentos de valores distintos con reconocimiento de agregaciones:
| Dialecto | ¿Es compatible? |
|---|---|
| Actian Avalanche | |
| Amazon Athena | |
| Amazon Aurora MySQL | |
| Amazon Redshift | |
| Amazon Redshift 2.1+ | |
| Amazon Redshift Serverless 2.1+ | |
| Apache Druid | |
| Apache Druid 0.13+ | |
| Apache Druid 0.18+ | |
| Apache Hive 2.3+ | |
| Apache Hive 3.1.2+ | |
| Apache Spark 3+ | |
| ClickHouse | |
| Cloudera Impala 3.1+ | |
| Cloudera Impala 3.1+ with Native Driver | |
| Cloudera Impala with Native Driver | |
| DataVirtuality | |
| Databricks | |
| Denodo 7 | |
| Denodo 8 & 9 | |
| Dremio | |
| Dremio 11+ | |
| Exasol | |
| Google BigQuery Legacy SQL | |
| Google BigQuery Standard SQL | |
| Google Cloud PostgreSQL | |
| Google Cloud SQL | |
| Google Spanner | |
| Greenplum | |
| HyperSQL | |
| IBM Netezza | |
| MariaDB | |
| Microsoft Azure PostgreSQL | |
| Microsoft Azure SQL Database | |
| Microsoft Azure Synapse Analytics | |
| Microsoft SQL Server 2008+ | |
| Microsoft SQL Server 2012+ | |
| Microsoft SQL Server 2016 | |
| Microsoft SQL Server 2017+ | |
| MongoBI | |
| MySQL | |
| MySQL 8.0.12+ | |
| Oracle | |
| Oracle ADWC | |
| PostgreSQL 9.5+ | |
| PostgreSQL pre-9.5 | |
| PrestoDB | |
| PrestoSQL | |
| SAP HANA | |
| SAP HANA 2+ | |
| SingleStore | |
| SingleStore 7+ | |
| Snowflake | |
| Teradata | |
| Trino | |
| Vector | |
| Vertica |
Consulta la documentación de tu dialecto de SQL para comprender las ventajas y desventajas de este método en términos de velocidad y precisión.