Apache Spark

Esta página contém informações sobre como conectar o Looker ao Apache Spark 3.

O Looker se conecta ao Apache Spark 3 ou mais recente por uma conexão JDBC ao servidor Thrift do Spark.

Criptografar o tráfego de rede

É uma prática recomendada criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.

Criar a conexão do Looker com seu banco de dados

Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.

Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Conectar o Looker ao seu banco de dados para mais informações. Algumas das configurações são descritas a seguir:

  • Nome: o nome da conexão. É assim que a conexão será referida no modelo do LookML.
  • Dialeto: selecione Apache Spark 3 ou mais recente.
  • Host: o host do servidor Thrift.
  • Porta: a porta do servidor Thrift (10000 por padrão).
  • Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados é especificado para uma tabela, esse é o padrão.
  • Nome de usuário: o usuário que o Looker vai autenticar.
  • Senha: a senha opcional do usuário do Looker.
  • Ativar TDPs: use essa opção para ativar as tabelas derivadas persistentes. Quando as TDPs estão ativadas, a janela Conexão mostra outras configurações de TDP e a seção Substituições de TDP.
  • Banco de dados temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado antes, com uma instrução como CREATE SCHEMA looker_scratch;.
  • Parâmetros JDBC adicionais: adicione outros parâmetros JDBC do Hive aqui, como:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: deixe essa opção desmarcada.
  • Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Normalmente, ele pode ser deixado em branco ou definido como UTC.
  • Fuso horário da consulta: o fuso horário para mostrar os dados consultados no Looker.

Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Testar a conectividade do banco de dados para informações sobre solução de problemas.

Para salvar essas configurações, clique em Conectar.

Suporte a recursos

Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa ser compatível com eles.

Apache Spark 3 ou mais recente

O Apache Spark 3+ é compatível com os seguintes recursos a partir do Looker 26.0:

Recurso Compatível?
Looker (Google Cloud Core)
Agregações simétricas
Tabelas derivadas
Tabelas derivadas persistentes em SQL
Tabelas derivadas nativas persistentes
Visualizações estáveis
Interrupção de consultas
Tabelas dinâmicas baseadas em SQL
Fusos horários
SSL
Subtotais
Parâmetros adicionais do JDBC
Diferenciação entre maiúsculas e minúsculas
Tipo de local
Tipo de lista
Percentil
Percentil distinto
Mostrar processos do SQL Runner
Descrever tabela do SQL Runner
Mostrar índices do SQL Runner
SQL Runner Select 10
Contagem do SQL Runner
Explicação do SQL
Credenciais do OAuth 2.0
Comentários contextuais
Pooling de conexão
Esboços HLL
Reconhecimento agregado
TDPs incrementais
Milissegundos
Microssegundos
Visualizações materializadas.
Medidas de comparação de períodos
Contagem aproximada aproximada

Próximas etapas

Depois de criar a conexão, defina as opções de autenticação.