cluster_keys

Utilizzo

view: view_name {
  derived_table: {
    cluster_keys: ["customer_city", "customer_state"]
    ...
  }
}
Gerarchia
cluster_keys

- o -

cluster_keys
Valore predefinito
None

Accetta
Uno o più nomi di colonne in cluster

Regole speciali
cluster_keys è supportato solo in dialetti specifici

Definizione

Il clustering di una tabella partizionata ordina i dati in una partizione in base ai valori delle colonne in cluster e organizza le colonne in cluster in blocchi di archiviazione di dimensioni ottimali. Il clustering può migliorare le prestazioni e ridurre il costo delle query che filtrano o aggregano in base alle colonne in cluster.

Consulta la sezione Supporto dei dialetti per cluster_keys per l'elenco dei dialetti che supportano cluster_keys.

Per aggiungere una colonna in cluster a una tabella derivata persistente (PDT) o a una tabella aggregata, utilizza il parametro cluster_keys e fornisci i nomi delle colonne che vuoi raggruppare nella tabella del database.

Esempi

Crea una tabella derivata nativa customer_order_facts su un database BigQuery, partizionata in base alla colonna date e in cluster in base alle colonne city, age_tier e gender per ottimizzare le query filtrate o aggregate in base a queste colonne:

view: customer_order_facts {
  derived_table: {
    explore_source: order {
      column: customer_id { field: order.customer_id }
      column: date { field: order.order_time }
      column: city { field: users.city}
      column: age_tier { field: users.age_tier }
      column: gender { field: users.gender }
      derived_column: num_orders {
        sql: COUNT(order.customer_id) ;;
      }
    }
    partition_keys: [ "date" ]
    cluster_keys: [ "city", "age_tier", "gender" ]
    datagroup_trigger: daily_datagroup
  }
}

Supporto dei dialetti per cluster_keys

La possibilità di utilizzare cluster_keys dipende dal dialetto del database utilizzato dalla connessione Looker. Nell'ultima release di Looker, i seguenti dialetti supportano cluster_keys:

Dialetto Supportata?
Actian Avalanche
Amazon Athena
Amazon Aurora MySQL
Amazon Redshift
Amazon Redshift 2.1+
Amazon Redshift Serverless 2.1+
Apache Druid
Apache Druid 0.13+
Apache Druid 0.18+
Apache Hive 2.3+
Apache Hive 3.1.2+
Apache Spark 3+
ClickHouse
Cloudera Impala 3.1+
Cloudera Impala 3.1+ with Native Driver
Cloudera Impala with Native Driver
DataVirtuality
Databricks
Denodo 7
Denodo 8 & 9
Dremio
Dremio 11+
Exasol
Google BigQuery Legacy SQL
Google BigQuery Standard SQL
Google Cloud PostgreSQL
Google Cloud SQL
Google Spanner
Greenplum
HyperSQL
IBM Netezza
MariaDB
Microsoft Azure PostgreSQL
Microsoft Azure SQL Database
Microsoft Azure Synapse Analytics
Microsoft SQL Server 2008+
Microsoft SQL Server 2012+
Microsoft SQL Server 2016
Microsoft SQL Server 2017+
MongoBI
MySQL
MySQL 8.0.12+
Oracle
Oracle ADWC
PostgreSQL 9.5+
PostgreSQL pre-9.5
PrestoDB
PrestoSQL
SAP HANA
SAP HANA 2+
SingleStore
SingleStore 7+
Snowflake
Teradata
Trino
Vector
Vertica