cluster_keys

Uso

view: view_name {
  derived_table: {
    cluster_keys: ["customer_city", "customer_state"]
    ...
  }
}
Hierarquia
cluster_keys

- ou -

cluster_keys
Valor padrão
None

Aceita
Um ou mais nomes de colunas agrupadas

Regras especiais
O cluster_keys só está disponível em dialetos específicos

Definição

O clustering de uma tabela particionada classifica os dados em uma partição com base nos valores das colunas em cluster e organiza essas colunas em blocos de armazenamento com o tamanho ideal. O clustering pode melhorar o desempenho e reduzir o custo das consultas que filtram ou agregam pelas colunas agrupadas.

Consulte a seção Suporte a dialetos para cluster_keys para ver a lista de dialetos que oferecem suporte a cluster_keys.

Para adicionar uma coluna em cluster a uma tabela derivada persistente (PDT) ou a uma tabela agregada, use o parâmetro cluster_keys e forneça os nomes das colunas que você quer em cluster na tabela do banco de dados.

Exemplos

Crie uma tabela derivada nativa customer_order_facts em um banco de dados do BigQuery, particionada na coluna date e em cluster nas colunas city, age_tier e gender para otimizar consultas filtradas ou agregadas nessas colunas:

view: customer_order_facts {
  derived_table: {
    explore_source: order {
      column: customer_id { field: order.customer_id }
      column: date { field: order.order_time }
      column: city { field: users.city}
      column: age_tier { field: users.age_tier }
      column: gender { field: users.gender }
      derived_column: num_orders {
        sql: COUNT(order.customer_id) ;;
      }
    }
    partition_keys: [ "date" ]
    cluster_keys: [ "city", "age_tier", "gender" ]
    datagroup_trigger: daily_datagroup
  }
}

Suporte a dialetos para cluster_keys

A capacidade de usar cluster_keys depende do dialeto do banco de dados usado pela sua conexão do Looker. Na versão mais recente do Looker, os seguintes dialetos são compatíveis com cluster_keys:

Dialeto Compatível?
Actian Avalanche
Amazon Athena
Amazon Aurora MySQL
Amazon Redshift
Amazon Redshift 2.1+
Amazon Redshift Serverless 2.1+
Apache Druid
Apache Druid 0.13+
Apache Druid 0.18+
Apache Hive 2.3+
Apache Hive 3.1.2+
Apache Spark 3+
ClickHouse
Cloudera Impala 3.1+
Cloudera Impala 3.1+ with Native Driver
Cloudera Impala with Native Driver
DataVirtuality
Databricks
Denodo 7
Denodo 8 & 9
Dremio
Dremio 11+
Exasol
Google BigQuery Legacy SQL
Google BigQuery Standard SQL
Google Cloud PostgreSQL
Google Cloud SQL
Google Spanner
Greenplum
HyperSQL
IBM Netezza
MariaDB
Microsoft Azure PostgreSQL
Microsoft Azure SQL Database
Microsoft Azure Synapse Analytics
Microsoft SQL Server 2008+
Microsoft SQL Server 2012+
Microsoft SQL Server 2016
Microsoft SQL Server 2017+
MongoBI
MySQL
MySQL 8.0.12+
Oracle
Oracle ADWC
PostgreSQL 9.5+
PostgreSQL pre-9.5
PrestoDB
PrestoSQL
SAP HANA
SAP HANA 2+
SingleStore
SingleStore 7+
Snowflake
Teradata
Trino
Vector
Vertica