En esta página, se incluye información para conectar Looker a Apache Hive 2.3+ y Apache Hive 3.1.2+.
Ten en cuenta lo siguiente sobre la compatibilidad de Looker con las diferentes versiones de Apache Hive:
- Looker admite conexiones a Apache Hive 2.3+ y Apache Hive 3.1.2+:
- Para Apache Hive 2.3+, Looker tiene compatibilidad a nivel de integración.
- Para Apache Hive 3.1.2+, Looker puede integrarse por completo con las bases de datos de Apache Hive 3 solo en versiones posteriores a 3.1.2. Esto se debe a un problema de análisis de consultas de las versiones 2.4.0 a 3.1.2 de Hive que generó tiempos de análisis extremadamente largos para el SQL generado por Looker.
- Looker no admite conexiones a Apache Hive 2. Las consultas sobre conexiones a Apache Hive 2 mostrarán un error.
Cómo encriptar el tráfico de red
Se recomienda encriptar el tráfico de red entre la aplicación de Looker y tu base de datos. Considera una de las opciones que se describen en la página de documentación Habilita el acceso seguro a la base de datos.
Introducción
Looker está diseñado para conectarse a un servidor de base de datos mediante JDBC. En el caso de Hive, este es el servidor de Thrift (HiveServer2). Consulta la documentación de Apache para obtener más información.
De forma predeterminada, este servidor escuchará en el puerto 10000.
Looker es una herramienta de consulta interactiva, por lo que espera trabajar con un motor de SQL interactivo. Si Hive se ejecuta en MapReduce (hive.execution.engine está configurado como mr), Hive mostrará los resultados de la consulta demasiado lento para ser práctico.
Looker se probó con Hive en Tez (hive.execution.engine=tez), aunque también es posible ejecutar Looker en Hive en Spark. Se agregó compatibilidad con Spark en la versión 1.1 de Hive. (Looker admite Hive 1.2.1+).
Tablas derivadas persistentes (PDT)
Para habilitar las tablas derivadas persistentes (PDT) en Looker con una conexión de Hive, crea un esquema de borrador para que lo use Looker. A continuación, se muestra un ejemplo de un comando que puedes usar para crear un esquema looker_scratch:
CREATE SCHEMA looker_scratch;
La cuenta de usuario que usa Looker para conectarse a Hive (que puede ser anónima si no se usa autenticación) debe tener las siguientes capacidades en el esquema de borrador:
- Crear tablas
- Alterar tablas
- Eliminar tablas
Prueba esto con un cliente JDBC antes de intentar crear PDT con Hive.
Colas
Si deseas que las consultas de Looker vayan a una cola específica, ingresa el parámetro de nombre de la cola en el campo Parámetros adicionales de JDBC de la página Configuración de conexión:
?tez.queue.name=the_bi_queue
Otros parámetros de Hive se pueden configurar de esta manera en el campo Parámetros adicionales de JDBC de la página Configuración de conexión.
Con los atributos de usuario, es posible que las consultas de diferentes usuarios o grupos de usuarios vayan a diferentes colas. Para ello, crea un atributo de usuario con un nombre como queue_name y, luego, en el campo Parámetros adicionales de JDBC , agrega lo siguiente:
?tez.queue.name={{ _user_attributes['queue_name'] }}
También puedes usar esto para personalizar otros parámetros de hive-site.xml por usuario o por grupo.
Cómo crear la conexión de Looker a tu base de datos
Sigue estos pasos para crear la conexión de Looker a tu base de datos:
- En la sección Administrador de Looker, selecciona Conexiones y, luego, haz clic en Agregar conexión.
Selecciona Apache Hive 2.3+ o Apache Hive 3.1.2+ en el menú desplegable Dialecto.
Completa los detalles de la conexión. La mayoría de los parámetros de configuración son comunes en la mayoría de los dialectos de bases de datos. Consulta la página de documentación Conecta Looker a tu base de datos para obtener información. A continuación, se describen algunos de los parámetros de configuración:
- Nombre: Especifica el nombre de la conexión. Así es como harás referencia a la conexión en los proyectos de LookML.
- Host: Especifica el nombre de host.
- Puerto: Especifica el puerto de la base de datos.
- Base de datos: Especifica el nombre de la base de datos.
- Nombre de usuario: Especifica el nombre de usuario de la base de datos.
- Contraseña: Especifica la contraseña del usuario de la base de datos.
- Habilitar PDT: Usa este botón de activación para habilitar las tablas derivadas persistentes. Cuando se habilitan las PDT, la ventana Conexión revela parámetros de configuración adicionales de PDT y la sección Invalidaciones de PDT.
- Base de datos temporal: Especifica el nombre del esquema de borrador creado en la sección Tablas derivadas persistentes (PDT) de esta página de documentación.
- Cantidad máxima de conexiones del compilador de PDT: Especifica la cantidad de compilaciones de PDT simultáneas posibles en esta conexión. Si estableces este valor demasiado alto, se podría afectar negativamente los tiempos de consulta. Para obtener más información, consulta la página de documentación Conecta Looker a tu base de datos.
- Parámetros adicionales de JDBC: Especifica los parámetros de cadena de JDBC adicionales.
- Programa de mantenimiento: Especifica una expresión
cronque indique cuándo Looker debe verificar los grupos de datos y las tablas derivadas persistentes. Obtén más información sobre este parámetro de configuración en la documentación Programa de mantenimiento. - SSL: Marca para usar conexiones SSL.
- Verificar SSL: Verifica la verificación del nombre de host.
- Cantidad máxima de conexiones por nodo: Este parámetro de configuración se puede dejar en el valor predeterminado inicialmente. Consulta la página de documentación Conecta Looker a tu base de datos para obtener más información.
- Tiempo de espera de la agrupación de conexiones: Este parámetro de configuración se puede dejar en el valor predeterminado inicialmente. Obtén más información sobre este parámetro de configuración en la sección Tiempo de espera de la agrupación de conexiones de la página de documentación Conecta Looker a tu base de datos.
- Almacenamiento previo en caché del Ejecutor de SQL: Para que el Ejecutor de SQL no precargue la información de la tabla y la cargue solo cuando se selecciona una tabla, borra esta opción. Obtén más información sobre este parámetro de configuración en la sección Almacenamiento previo en caché del Ejecutor de SQL de la página de documentación Conecta Looker a tu base de datos.
- Zona horaria de la base de datos: Especifica la zona horaria que se usa en la base de datos. Deja este campo en blanco si no deseas la conversión de zona horaria. Consulta la página de documentación Usa la configuración de zona horaria para obtener más información.
Para verificar que la conexión se realice correctamente, haz clic en Probar. Consulta la página de documentación Prueba la conectividad de la base de datos para obtener información sobre la solución de problemas.
Para guardar esta configuración, haz clic en Conectar.
Compatibilidad de características
Para que Looker admita algunas funciones, el dialecto de tu base de datos también debe admitirlas.
Apache Hive 2.3+
Apache Hive 2.3+ admite las siguientes funciones a partir de Looker 26.2:
| Función | ¿Es compatible? |
|---|---|
| Looker (Google Cloud Core) | |
| Agregaciones simétricas | |
| Tablas derivadas | |
| Tablas derivadas persistentes basadas en SQL | |
| Tablas derivadas persistentes nativas | |
| Vistas estables | |
| Eliminación de consultas | |
| Tablas dinámicas basadas en SQL | |
| Zonas horarias | |
| SSL | |
| Subtotales | |
| Parámetros adicionales de JDBC | |
| Distinción entre mayúsculas y minúsculas | |
| Tipo de ubicación | |
| Tipo de lista | |
| Percentil | |
| Percentil de valores distintos | |
| Mostrar procesos del Ejecutor de SQL | |
| Describir tabla del Ejecutor de SQL | |
| Mostrar índices del Ejecutor de SQL | |
| Seleccionar 10 del Ejecutor de SQL | |
| Recuento del Ejecutor de SQL | |
| Explicar SQL | |
| Credenciales de OAuth 2.0 | |
| Comentarios contextuales | |
| Agrupación de conexiones | |
| Esbozos de HLL | |
| Reconocimiento agregado | |
| PDT incrementales | |
| Milisegundos | |
| Microsegundos | |
| Vistas materializadas | |
| Medidas entre períodos | |
| Distinción de recuento aproximado |
Apache Hive 3.1.2+
Apache Hive 3.1.2+ admite las siguientes funciones a partir de Looker 26.2:
| Función | ¿Es compatible? |
|---|---|
| Looker (Google Cloud Core) | |
| Agregaciones simétricas | |
| Tablas derivadas | |
| Tablas derivadas persistentes basadas en SQL | |
| Tablas derivadas persistentes nativas | |
| Vistas estables | |
| Eliminación de consultas | |
| Tablas dinámicas basadas en SQL | |
| Zonas horarias | |
| SSL | |
| Subtotales | |
| Parámetros adicionales de JDBC | |
| Distinción entre mayúsculas y minúsculas | |
| Tipo de ubicación | |
| Tipo de lista | |
| Percentil | |
| Percentil de valores distintos | |
| Mostrar procesos del Ejecutor de SQL | |
| Describir tabla del Ejecutor de SQL | |
| Mostrar índices del Ejecutor de SQL | |
| Seleccionar 10 del Ejecutor de SQL | |
| Recuento del Ejecutor de SQL | |
| Explicar SQL | |
| Credenciales de OAuth 2.0 | |
| Comentarios contextuales | |
| Agrupación de conexiones | |
| Esbozos de HLL | |
| Reconocimiento agregado | |
| PDT incrementales | |
| Milisegundos | |
| Microsegundos | |
| Vistas materializadas | |
| Medidas entre períodos | |
| Distinción de recuento aproximado |
Próximos pasos
Después de conectar tu base de datos a Looker, configura las opciones de acceso para tus usuarios.