Apache Spark

Esta página contém informações sobre como conectar o Looker ao Apache Spark 3.

O Looker se conecta ao Apache Spark 3 e versões mais recentes por uma conexão JDBC ao servidor Thrift do Spark.

Como criptografar o tráfego de rede

Uma prática recomendada é criptografar o tráfego de rede entre o aplicativo Looker e o banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.

Como criar a conexão do Looker com o banco de dados

Na seção Admin do Looker, selecione Connections e clique em Add Connection.

Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Como conectar o Looker ao banco de dados para mais informações. Algumas das configurações são descritas a seguir:

  • Nome: o nome da conexão. É assim que a conexão será referida no modelo do LookML.
  • Dialect: selecione Apache Spark 3+.
  • Host: o host do servidor Thrift.
  • Port : a porta do servidor Thrift (10000 por padrão).
  • Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados é especificado para uma tabela, ele é assumido.
  • Nome de usuário: o usuário que o Looker vai autenticar como.
  • Senha: a senha opcional para o usuário do Looker.
  • Ativar PDTs: Use essa opção para ativar tabelas derivadas persistentes. Quando as PDTs estão ativadas, a janela Connection revela outras configurações de PDT e a seção PDT Overrides.
  • Banco de Dados Temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado com antecedência, com uma instrução como CREATE SCHEMA looker_scratch;.
  • Additional JDBC parameters: adicione outros parâmetros JDBC do Hive aqui, como:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: deixe essa opção desmarcada.
  • Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Geralmente, ele pode ser deixado em branco ou definido como UTC.
  • Fuso horário de consultas: o fuso horário para mostrar os dados consultados no Looker.

Para verificar se a conexão foi estabelecida, clique em Test. Consulte a página de documentação Testar a conectividade do banco de dados para informações sobre solução de problemas.

Para salvar essas configurações, clique em Connect.

Suporte a recursos

Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa oferecer suporte a eles.

Apache Spark 3 e versões mais recentes

O Apache Spark 3 e versões mais recentes oferecem suporte aos seguintes recursos do Looker 26.2:

Recurso Compatível?
Looker (Google Cloud Core)
Conjuntos simétricos
Tabelas derivadas
Tabelas derivadas SQL persistentes
Tabelas derivadas nativas persistentes
Visualizações estáveis
Interrupção de consultas
Tabelas dinâmicas baseadas em SQL
Fusos horários
SSL
Subtotais
Parâmetros adicionais da JDBC
Diferenciação entre maiúsculas e minúsculas
Tipo de local
Tipo de lista
Percentil
Percentil distinto
Mostrar processos do SQL Runner
Descrever tabela do SQL Runner
Mostrar índices do SQL Runner
Selecionar 10 do SQL Runner
Contagem do SQL Runner
Explicar SQL
Credenciais do OAuth 2.0
Comentários de contexto
Pooling de conexão
Esboços HLL
Reconhecimento agregado
PDTs incrementais
Milissegundos
Microssegundos
Visualizações materializadas
Medidas de comparação de períodos
Contagem aproximada aproximada

Próximas etapas

Depois de criar a conexão, defina as opções de autenticação.