Uso
view: view_name {
derived_table: {
cluster_keys: ["customer_city", "customer_state"]
...
}
}
|
Hierarquia
cluster_keys- ou - cluster_keys |
Valor padrão
None
Aceita
Um ou mais nomes de colunas agrupadas
Regras especiais
O cluster_keys só está disponível em dialetos específicos
|
Definição
O clustering de uma tabela particionada classifica os dados em uma partição com base nos valores das colunas em cluster e organiza essas colunas em blocos de armazenamento com o tamanho ideal. O clustering pode melhorar o desempenho e reduzir o custo das consultas que filtram ou agregam pelas colunas agrupadas.
Consulte a seção Suporte a dialetos para cluster_keys para ver a lista de dialetos que oferecem suporte a cluster_keys.
Para adicionar uma coluna em cluster a uma tabela derivada persistente (PDT) ou a uma tabela agregada, use o parâmetro cluster_keys e forneça os nomes das colunas que você quer em cluster na tabela do banco de dados.
Exemplos
Crie uma tabela derivada nativa customer_order_facts em um banco de dados do BigQuery, particionada na coluna date e em cluster nas colunas city, age_tier e gender para otimizar consultas filtradas ou agregadas nessas colunas:
view: customer_order_facts {
derived_table: {
explore_source: order {
column: customer_id { field: order.customer_id }
column: date { field: order.order_time }
column: city { field: users.city}
column: age_tier { field: users.age_tier }
column: gender { field: users.gender }
derived_column: num_orders {
sql: COUNT(order.customer_id) ;;
}
}
partition_keys: [ "date" ]
cluster_keys: [ "city", "age_tier", "gender" ]
datagroup_trigger: daily_datagroup
}
}
Suporte a dialetos para cluster_keys
A capacidade de usar cluster_keys depende do dialeto do banco de dados usado pela sua conexão do Looker. Na versão mais recente do Looker, os seguintes dialetos são compatíveis com cluster_keys:
| Dialeto | Compatível? |
|---|---|
| Actian Avalanche | |
| Amazon Athena | |
| Amazon Aurora MySQL | |
| Amazon Redshift | |
| Amazon Redshift 2.1+ | |
| Amazon Redshift Serverless 2.1+ | |
| Apache Druid | |
| Apache Druid 0.13+ | |
| Apache Druid 0.18+ | |
| Apache Hive 2.3+ | |
| Apache Hive 3.1.2+ | |
| Apache Spark 3+ | |
| ClickHouse | |
| Cloudera Impala 3.1+ | |
| Cloudera Impala 3.1+ with Native Driver | |
| Cloudera Impala with Native Driver | |
| DataVirtuality | |
| Databricks | |
| Denodo 7 | |
| Denodo 8 & 9 | |
| Dremio | |
| Dremio 11+ | |
| Exasol | |
| Google BigQuery Legacy SQL | |
| Google BigQuery Standard SQL | |
| Google Cloud PostgreSQL | |
| Google Cloud SQL | |
| Google Spanner | |
| Greenplum | |
| HyperSQL | |
| IBM Netezza | |
| MariaDB | |
| Microsoft Azure PostgreSQL | |
| Microsoft Azure SQL Database | |
| Microsoft Azure Synapse Analytics | |
| Microsoft SQL Server 2008+ | |
| Microsoft SQL Server 2012+ | |
| Microsoft SQL Server 2016 | |
| Microsoft SQL Server 2017+ | |
| MongoBI | |
| MySQL | |
| MySQL 8.0.12+ | |
| Oracle | |
| Oracle ADWC | |
| PostgreSQL 9.5+ | |
| PostgreSQL pre-9.5 | |
| PrestoDB | |
| PrestoSQL | |
| SAP HANA | |
| SAP HANA 2+ | |
| SingleStore | |
| SingleStore 7+ | |
| Snowflake | |
| Teradata | |
| Trino | |
| Vector | |
| Vertica |