Apache Spark

Questa pagina contiene informazioni sulla connessione di Looker ad Apache Spark 3.

Looker si connette ad Apache Spark 3+ tramite una connessione JDBC allo Spark Thrift Server.

Criptare il traffico di rete

È una best practice criptare il traffico di rete tra l'applicazione Looker e il tuo database. Valuta una delle opzioni descritte nella pagina della documentazione Abilita l'accesso sicuro ai database.

Creare la connessione Looker al database

Nella sezione Amministrazione di Looker, seleziona Connessioni e poi fai clic su Aggiungi connessione.

Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggioranza dei dialetti di database. Per informazioni, consulta la pagina della documentazione Connessione di Looker al tuo database. Di seguito sono descritte alcune delle impostazioni:

  • Nome: il nome della connessione. Questo è il modo in cui verrà fatto riferimento alla connessione nel modello LookML.
  • Dialetto: seleziona Apache Spark 3+.
  • Host: l'host del server Thrift.
  • Porta : la porta del server Thrift (10000 per impostazione predefinita).
  • Database: lo schema/database predefinito che verrà modellato. Se non viene specificato alcun database per una tabella, questo verrà presupposto.
  • Nome utente: l'utente con cui Looker eseguirà l'autenticazione.
  • Password: la password facoltativa per l'utente Looker.
  • Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per abilitare le tabelle derivate permanenti. Quando le PDT sono abilitate, la finestra Connessione mostra impostazioni PDT aggiuntive e la sezione Override PDT.
  • Database temporaneo: uno schema/database temporaneo per l'archiviazione delle PDT. Deve essere creato in anticipo con un'istruzione come CREATE SCHEMA looker_scratch;.
  • Parametri JDBC aggiuntivi: aggiungi eventuali parametri JDBC aggiuntivi. Per un elenco dei parametri supportati, consulta la sezione Parametri JDBC supportati in questa pagina.
  • SSL: lascia questa opzione deselezionata.
  • Fuso orario database: il fuso orario dei dati archiviati in Spark. In genere può essere lasciato vuoto o impostato su UTC.
  • Fuso orario query: il fuso orario in cui visualizzare i dati sottoposti a query in Looker.

Per verificare che la connessione sia riuscita, fai clic su Test. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione Testare la connettività del database.

Per salvare queste impostazioni, fai clic su Connetti.

Parametri JDBC supportati

Per Apache Spark, Looker supporta i seguenti parametri JDBC nel campo Parametri JDBC aggiuntivi per la connessione. Per informazioni su questi parametri, consulta la documentazione del tuo database.

  • batchsize
  • cascadeTruncate
  • connectionProvider
  • createTableColumnTypes
  • createTableOptions
  • customSchema
  • dbtable
  • fetchsize
  • isolationLevel
  • keytab
  • lowerBound
  • numPartitions
  • oracle.jdbc.mapDateToTimestamp
  • partitionColumn
  • password
  • preferTimestampNTZ
  • prepareQuery
  • principal
  • pushDownAggregate
  • pushDownLimit
  • pushDownOffset
  • pushDownPredicate
  • pushDownTableSample
  • query
  • queryTimeout
  • sessionInitStatement
  • truncate
  • upperBound
  • url
  • user

Funzionalità supportate

Affinché Looker supporti alcune funzionalità, anche il dialetto del database deve supportarle.

Apache Spark 3+

A partire da Looker 26.10, Apache Spark 3+ supporta le seguenti funzionalità:

Funzionalità Supportata?
Looker (Google Cloud core)
Aggregati simmetrici
Tabelle derivate
Tabelle derivate SQL permanenti
Tabelle derivate permanenti native
Visualizzazioni stabili
Interruzione delle query
Pivot basati su SQL
Fusi orari
SSL
Subtotali
Parametri JDBC aggiuntivi
Maiuscole/minuscole
Tipo di località
Tipo di elenco
Percentile
Percentile valori distinti
SQL Runner Mostra processi
SQL Runner Descrivi tabella
SQL Runner Mostra indici
SQL Runner Seleziona 10
SQL Runner Conteggio
Spiega SQL
Credenziali OAuth 2.0
Commenti di contesto
Pool di connessioni
Schizzi HLL
Riconoscimento degli aggregati
PDT incrementali
Millisecondi
Microsecondi
Viste materializzate
Misure in base al periodo
Conteggio approssimato valori distinti
Modelli analitici in-database
Calendari personalizzati

Passaggi successivi

Dopo aver creato la connessione, imposta le opzioni di autenticazione.