Utilizzo
view: view_name {
derived_table: {
cluster_keys: ["customer_city", "customer_state"]
...
}
}
|
Gerarchia
cluster_keys- o - cluster_keys |
Valore predefinito
None
Accetta
Uno o più nomi di colonne in cluster
Regole speciali
cluster_keys è supportato solo in dialetti specifici
|
Definizione
Il clustering di una tabella partizionata ordina i dati in una partizione in base ai valori delle colonne in cluster e organizza le colonne in cluster in blocchi di archiviazione di dimensioni ottimali. Il clustering può migliorare le prestazioni e ridurre il costo delle query che filtrano o aggregano in base alle colonne in cluster.
Consulta la sezione Supporto dei dialetti per cluster_keys per l'elenco dei dialetti che supportano cluster_keys.
Per aggiungere una colonna in cluster a una tabella derivata persistente (PDT) o a una tabella aggregata, utilizza il parametro cluster_keys e fornisci i nomi delle colonne che vuoi raggruppare nella tabella del database.
Esempi
Crea una tabella derivata nativa customer_order_facts su un database BigQuery, partizionata in base alla colonna date e in cluster in base alle colonne city, age_tier e gender per ottimizzare le query filtrate o aggregate in base a queste colonne:
view: customer_order_facts {
derived_table: {
explore_source: order {
column: customer_id { field: order.customer_id }
column: date { field: order.order_time }
column: city { field: users.city}
column: age_tier { field: users.age_tier }
column: gender { field: users.gender }
derived_column: num_orders {
sql: COUNT(order.customer_id) ;;
}
}
partition_keys: [ "date" ]
cluster_keys: [ "city", "age_tier", "gender" ]
datagroup_trigger: daily_datagroup
}
}
Supporto dei dialetti per cluster_keys
La possibilità di utilizzare cluster_keys dipende dal dialetto del database utilizzato dalla connessione Looker. Nell'ultima release di Looker, i seguenti dialetti supportano cluster_keys:
| Dialetto | Supportata? |
|---|---|
| Actian Avalanche | |
| Amazon Athena | |
| Amazon Aurora MySQL | |
| Amazon Redshift | |
| Amazon Redshift 2.1+ | |
| Amazon Redshift Serverless 2.1+ | |
| Apache Druid | |
| Apache Druid 0.13+ | |
| Apache Druid 0.18+ | |
| Apache Hive 2.3+ | |
| Apache Hive 3.1.2+ | |
| Apache Spark 3+ | |
| ClickHouse | |
| Cloudera Impala 3.1+ | |
| Cloudera Impala 3.1+ with Native Driver | |
| Cloudera Impala with Native Driver | |
| DataVirtuality | |
| Databricks | |
| Denodo 7 | |
| Denodo 8 & 9 | |
| Dremio | |
| Dremio 11+ | |
| Exasol | |
| Google BigQuery Legacy SQL | |
| Google BigQuery Standard SQL | |
| Google Cloud PostgreSQL | |
| Google Cloud SQL | |
| Google Spanner | |
| Greenplum | |
| HyperSQL | |
| IBM Netezza | |
| MariaDB | |
| Microsoft Azure PostgreSQL | |
| Microsoft Azure SQL Database | |
| Microsoft Azure Synapse Analytics | |
| Microsoft SQL Server 2008+ | |
| Microsoft SQL Server 2012+ | |
| Microsoft SQL Server 2016 | |
| Microsoft SQL Server 2017+ | |
| MongoBI | |
| MySQL | |
| MySQL 8.0.12+ | |
| Oracle | |
| Oracle ADWC | |
| PostgreSQL 9.5+ | |
| PostgreSQL pre-9.5 | |
| PrestoDB | |
| PrestoSQL | |
| SAP HANA | |
| SAP HANA 2+ | |
| SingleStore | |
| SingleStore 7+ | |
| Snowflake | |
| Teradata | |
| Trino | |
| Vector | |
| Vertica |