Esta página contém informações sobre como conectar o Looker ao Apache Spark 3.
O Looker se conecta ao Apache Spark 3 ou mais recente por uma conexão JDBC com o servidor Thrift do Spark.
Criptografar o tráfego de rede
É uma prática recomendada criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.
Criar a conexão do Looker com seu banco de dados
Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.
Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Conectar o Looker ao seu banco de dados para mais informações. Algumas das configurações são descritas a seguir:
- Nome: o nome da conexão. É assim que a conexão será referida no modelo do LookML.
- Dialeto: selecione Apache Spark 3 ou mais recente.
- Host: o host do servidor Thrift.
- Porta: a porta do servidor Thrift (10000 por padrão).
- Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados é especificado para uma tabela, esse é o padrão.
- Nome de usuário: o usuário que o Looker vai autenticar.
- Senha: a senha opcional do usuário do Looker.
- Ativar TDPs: use essa opção para ativar as tabelas derivadas persistentes. Quando as TDPs estão ativadas, a janela Conexão mostra outras configurações de TDP e a seção Substituições de TDP.
- Banco de dados temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado antes, com uma instrução como
CREATE SCHEMA looker_scratch;. - Parâmetros JDBC adicionais: adicione outros parâmetros JDBC do Hive aqui, como:
;spark.sql.inMemoryColumnarStorage.compressed=true;auth=noSasl
- SSL: deixe essa opção desmarcada.
- Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Normalmente, ele pode ser deixado em branco ou definido como UTC.
- Fuso horário da consulta: o fuso horário para mostrar os dados consultados no Looker.
Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Testar a conectividade do banco de dados para informações sobre solução de problemas.
Para salvar essas configurações, clique em Conectar.
Suporte a recursos
Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa ser compatível com eles.
Apache Spark 3 ou mais recente
O Apache Spark 3+ é compatível com os seguintes recursos a partir do Looker 25.18:
| Recurso | Compatível? |
|---|---|
| Nível de suporte | Com suporte |
| Looker (Google Cloud Core) | Sim |
| Agregações simétricas | Sim |
| Tabelas derivadas | Sim |
| Tabelas derivadas persistentes do SQL | Sim |
| Tabelas derivadas nativas persistentes | Sim |
| Visualizações estáveis | Sim |
| Interrupção de consultas | Sim |
| Tabelas dinâmicas baseadas em SQL | Sim |
| Fusos horários | Sim |
| SSL | Sim |
| Subtotais | Sim |
| Parâmetros adicionais do JDBC | Sim |
| Diferenciação entre maiúsculas e minúsculas | Sim |
| Tipo de local | Sim |
| Tipo de lista | Sim |
| Percentil | Sim |
| Percentil distinto | Não |
| Mostrar processos do SQL Runner | Não |
| Descrever tabela do SQL Runner | Sim |
| Mostrar índices do SQL Runner | Não |
| Selecionar 10 no SQL Runner | Sim |
| Contagem do SQL Runner | Sim |
| Explicação do SQL | Sim |
| Credenciais do OAuth 2.0 | Não |
| Comentários de contexto | Sim |
| Pooling de conexão | Não |
| Esboços HLL | Não |
| Reconhecimento agregado | Sim |
| TDPs incrementais | Não |
| Milissegundos | Sim |
| Microssegundos | Sim |
| Visualizações materializadas. | Não |
| Medidas de comparação de períodos | Não |
| Contagem aproximada aproximada | Não |
Próximas etapas
Depois de criar a conexão, defina as opções de autenticação.