Esta página contém informações sobre como conectar o Looker ao Apache Spark 3.
O Looker se conecta ao Apache Spark 3 e versões mais recentes por uma conexão JDBC ao servidor Thrift do Spark.
Como criptografar o tráfego de rede
Uma prática recomendada é criptografar o tráfego de rede entre o aplicativo Looker e o banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.
Como criar a conexão do Looker com o banco de dados
Na seção Admin do Looker, selecione Connections e clique em Add Connection.
Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Como conectar o Looker ao banco de dados para mais informações. Algumas das configurações são descritas a seguir:
- Nome: o nome da conexão. É assim que a conexão será referida no modelo do LookML.
- Dialect: selecione Apache Spark 3+.
- Host: o host do servidor Thrift.
- Port : a porta do servidor Thrift (10000 por padrão).
- Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados é especificado para uma tabela, ele é assumido.
- Nome de usuário: o usuário que o Looker vai autenticar como.
- Senha: a senha opcional para o usuário do Looker.
- Ativar PDTs: Use essa opção para ativar tabelas derivadas persistentes. Quando as PDTs estão ativadas, a janela Connection revela outras configurações de PDT e a seção PDT Overrides.
- Banco de Dados Temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado com antecedência, com uma instrução como
CREATE SCHEMA looker_scratch;. - Additional JDBC parameters: adicione outros parâmetros JDBC do Hive aqui, como:
;spark.sql.inMemoryColumnarStorage.compressed=true;auth=noSasl
- SSL: deixe essa opção desmarcada.
- Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Geralmente, ele pode ser deixado em branco ou definido como UTC.
- Fuso horário de consultas: o fuso horário para mostrar os dados consultados no Looker.
Para verificar se a conexão foi estabelecida, clique em Test. Consulte a página de documentação Testar a conectividade do banco de dados para informações sobre solução de problemas.
Para salvar essas configurações, clique em Connect.
Suporte a recursos
Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa oferecer suporte a eles.
Apache Spark 3 e versões mais recentes
O Apache Spark 3 e versões mais recentes oferecem suporte aos seguintes recursos do Looker 26.2:
| Recurso | Compatível? |
|---|---|
| Looker (Google Cloud Core) | |
| Conjuntos simétricos | |
| Tabelas derivadas | |
| Tabelas derivadas SQL persistentes | |
| Tabelas derivadas nativas persistentes | |
| Visualizações estáveis | |
| Interrupção de consultas | |
| Tabelas dinâmicas baseadas em SQL | |
| Fusos horários | |
| SSL | |
| Subtotais | |
| Parâmetros adicionais da JDBC | |
| Diferenciação entre maiúsculas e minúsculas | |
| Tipo de local | |
| Tipo de lista | |
| Percentil | |
| Percentil distinto | |
| Mostrar processos do SQL Runner | |
| Descrever tabela do SQL Runner | |
| Mostrar índices do SQL Runner | |
| Selecionar 10 do SQL Runner | |
| Contagem do SQL Runner | |
| Explicar SQL | |
| Credenciais do OAuth 2.0 | |
| Comentários de contexto | |
| Pooling de conexão | |
| Esboços HLL | |
| Reconhecimento agregado | |
| PDTs incrementais | |
| Milissegundos | |
| Microssegundos | |
| Visualizações materializadas | |
| Medidas de comparação de períodos | |
| Contagem aproximada aproximada |
Próximas etapas
Depois de criar a conexão, defina as opções de autenticação.