Looker admite conexiones a Amazon Athena, un servicio de consultas interactivas que te permite analizar datos en Amazon S3 con SQL estándar. Amazon Athena no tiene servidores, por lo que no hay una infraestructura para administrar. Solo se te cobra por las consultas que se ejecutan.
Encripta el tráfico de red
Se recomienda encriptar el tráfico de red entre la aplicación de Looker y tu base de datos. Considera una de las opciones que se describen en la página de documentación Habilita el acceso seguro a la base de datos.
Configura una conexión de Amazon Athena
En esta página, se describe cómo conectar Looker a una instancia de Amazon Athena.
Asegúrate de tener lo siguiente:
- Un par de claves de acceso de Amazon AWS
El bucket de S3 que contiene los datos que deseas consultar en Looker con Amazon Athena Las claves de acceso de Amazon AWS deben tener acceso de lectura y escritura a este bucket.
Amazon Athena debe tener acceso a este bucket de S3 a través de un rol o un conjunto de permisos, así como a través de reglas de firewall. No agregues reglas de seguridad al bucket de S3 para la IP de Looker, ya que esto puede bloquear de forma involuntaria el acceso de Amazon Athena al bucket de S3. (Para otros dialectos además de Amazon Athena, es posible que los usuarios deseen limitar el acceso a los datos desde la capa de red con una lista de entidades permitidas de IP, como se describe en la página de documentación Habilita el acceso seguro a la base de datos).
Conocimiento de la ubicación de los datos de tu instancia de Amazon Athena El nombre de la región se puede encontrar en la parte superior derecha de la consola de Amazon.
En la sección Administrador de Looker, selecciona Conexiones y, luego, haz clic en Agregar conexión.
Completa los detalles de la conexión:
- Nombre: Especifica el nombre de la conexión. Así es como harás referencia a la conexión en los proyectos de LookML.
- Dialecto: Selecciona Amazon Athena.
- Host y Puerto: Especifica el nombre del host y el puerto como se describe en la documentación de Athena sobre el formato de URL de JDBC. El host debe ser un extremo de Amazon válido (como
athena.eu-west-1.amazonaws.com) y el puerto debe permanecer en443. Puedes encontrar una lista actualizada de los extremos que admiten Athena en esta página de referencia general de AWS. - Base de datos: Especifica la base de datos predeterminada que deseas modelar. Se puede acceder a otras bases de datos, pero Looker trata esta base de datos como la predeterminada.
- Nombre de usuario: Especifica el ID de la clave de acceso de AWS.
- Contraseña: Especifica la clave de acceso secreta de AWS.
- Habilitar PDT: Usa este botón de activación para habilitar las tablas derivadas persistentes (PDT). Si habilitas las PDT, se mostrarán campos adicionales de PDT y la sección Anulaciones de PDT para la conexión.
- Base de datos temporal: Especifica el nombre del directorio de salida en tu bucket de S3 en el que deseas que Looker escriba tus PDT. La ruta de acceso completa a tu directorio de salida debe especificarse en el campo Parámetros adicionales de JDBC. Consulta la sección Especifica tu bucket de S3 para la salida de los resultados de las consultas y las PDT en esta página.
- Cantidad máxima de conexiones del compilador de PDT: Especifica la cantidad de compilaciones de PDT simultáneas posibles en esta conexión. Si estableces este valor demasiado alto, podría afectar negativamente los tiempos de consulta. Para obtener más información, consulta la página de documentación Conecta Looker a tu base de datos.
- Parámetros adicionales de JDBC: Especifica parámetros adicionales para la conexión:
- El parámetro
s3_staging_dires el bucket de S3 que Looker debe usar para la salida de los resultados de las consultas y las PDT. Consulta la sección Especifica tu bucket de S3 para la salida de los resultados de las consultas y las PDT en esta página. - Marca para transmitir resultados. Si tienes la política
athena:GetQueryResultsStreamadjunta a tu usuario de Athena, puedes agregar;UseResultsetStreaming=1al final de tus parámetros adicionales de JDBC para mejorar significativamente el rendimiento de la extracción de conjuntos de resultados grandes. Este parámetro se establece en0de forma predeterminada. - Parámetros adicionales opcionales para agregar a la cadena de conexión de JDBC. Consulta la sección Parámetros de JDBC admitidos en esta página para obtener la lista de parámetros que admite Looker.
- El parámetro
- SSL: Ignora; de forma predeterminada, se encriptarán todas las conexiones a la API de AWS.
- Cantidad máxima de conexiones por nodo: De forma predeterminada, se establece en 5. Puedes aumentar este valor hasta 20 si Looker es el motor de consultas principal que se ejecuta en Athena. Consulta la documentación de límites del servicio de Athena para obtener más detalles sobre los límites del servicio. Para obtener más información, consulta la página de documentación Conecta Looker a tu base de datos.
- Tiempo de espera del grupo de conexiones: Especifica el tiempo de espera del grupo de conexiones. De forma predeterminada, el tiempo de espera se establece en 120 segundos. Para obtener más información, consulta la página de documentación Conecta Looker a tu base de datos.
- Almacenamiento previo en caché del Ejecutor de SQL: Anula la selección de esta opción si prefieres que el Ejecutor de SQL cargue la información de la tabla solo cuando se selecciona una tabla. Para obtener más información, consulta la página de documentación Conecta Looker a tu base de datos.
- Zona horaria de la base de datos: Especifica la zona horaria que se usa en la base de datos. Deja este campo en blanco si no deseas la conversión de zona horaria. Para obtener más información, consulta la página de documentación Usa la configuración de zona horaria.
Para verificar que la conexión se realice correctamente, haz clic en Probar. Consulta la página de documentación Prueba la conectividad de la base de datos para obtener información sobre la solución de problemas.
Para guardar esta configuración, haz clic en Conectar.
Especifica tu bucket de S3 para la salida de los resultados de las consultas y las PDT
Usa el campo Parámetros adicionales de JDBC de la página Conexiones para configurar la ruta de acceso al bucket de S3 que Looker usará para almacenar la salida de los resultados de las consultas y para especificar el nombre del directorio de salida en el bucket de S3 en el que deseas que Looker escriba las PDT. Especifica esta información con el parámetro s3_staging_dir.
El parámetro JDBC s3_staging_dir es una forma alternativa de configurar la propiedad S3OutputLocation de Amazon Athena, que es obligatoria para las conexiones JDBC de Athena. Consulta la documentación de Athena sobre las opciones del controlador JDBC para obtener más información y una lista de todas las opciones disponibles del controlador JDBC.
En el campo Parámetros adicionales de JDBC, especifica el parámetro s3_staging_dir con el siguiente formato:
`s3_staging_dir=s3://<s3-bucket>/<output-path>`
Aquí:
<s3-bucket>es el nombre del bucket de S3.<output-path>es la ruta de acceso en la que Looker escribirá la salida de los resultados de las consultas.
El par de claves de acceso de AWS debe tener permisos de escritura en el directorio
<s3-bucket>.
Para configurar el directorio en el que Looker escribirá las PDT, ingresa la ruta de acceso del directorio en el bucket de S3 en el campo Base de datos temporal.
Por ejemplo, si deseas que Looker escriba PDT en s3://<s3-bucket>/looker_scratch, ingresa lo siguiente en el campo Base de datos temporal:
`looker_scratch`
Solo ingresa la ruta de acceso del directorio. Looker obtiene el nombre del bucket de S3 del parámetro s3_staging_dir que ingresas en el campo Parámetros adicionales de JDBC.
Consideraciones sobre el bucket de S3
Te recomendamos que configures los ciclos de vida de los objetos de Amazon S3 para limpiar periódicamente los archivos innecesarios en el bucket de S3 especificado. Estos son los motivos:
- Athena almacena los resultados de las consultas para cada consulta en un bucket de S3. Consulta Consultas de Athena.
- Si tienes habilitadas las PDT, cuando se compila una PDT, los metadatos sobre la tabla creada se almacenan en el bucket de S3.
Recursos
- Documentación de Amazon Athena
- Consola de Amazon Web Services para Athena (requiere acceso a AWS)
- Referencia de SQL y HiveQL de Amazon Athena
Parámetros de JDBC admitidos
En el caso de Amazon Athena, Looker admite los siguientes parámetros de JDBC en el campo Parámetros adicionales de JDBC para la conexión. Consulta la documentación de tu base de datos para obtener información sobre estos parámetros.
ApplicationNameAwsCredentialsProviderArgumentsAwsCredentialsProviderClassAwsRegionCatalogDatabaseEnableResultReuseByAgeEndPointOverrideLogLevelMaxQueryExecutionPollingIntervalmaxResultReuseAgeInMinutesMetadataRetrievalMethodMinQueryExecutionPollingIntervalOutputLocationpasswordProxyHostProxyPortProxyPWDProxyUIDQueryExecutionPollingIntervalMultiplierRegionResultFetcherResultReuseByAgeConfigurations3_staging_dirS3OutputEncOptionS3OutputLocationSchemauserUseResultsetStreamingWorkGroup
Compatibilidad de características
Para que Looker admita algunas funciones, el dialecto de tu base de datos también debe admitirlas.
A partir de Looker 26.8, Amazon Athena admite las siguientes funciones:
| Función | ¿Es compatible? |
|---|---|
| Looker (Google Cloud Core) | |
| Agregaciones simétricas | |
| Tablas derivadas | |
| Tablas derivadas persistentes basadas en SQL | |
| Tablas derivadas persistentes nativas | |
| Vistas estables | |
| Eliminación de consultas | |
| Tablas dinámicas basadas en SQL | |
| Zonas horarias | |
| SSL | |
| Subtotales | |
| Parámetros adicionales de JDBC | |
| Distinción entre mayúsculas y minúsculas | |
| Tipo de ubicación | |
| Tipo de lista | |
| Percentil | |
| Percentil de valores distintos | |
| Mostrar procesos del Ejecutor de SQL | |
| Describir tabla del Ejecutor de SQL | |
| Mostrar índices del Ejecutor de SQL | |
| Seleccionar 10 del Ejecutor de SQL | |
| Recuento del Ejecutor de SQL | |
| Explicar SQL | |
| Credenciales de OAuth 2.0 | |
| Comentarios contextuales | |
| Agrupación de conexiones | |
| Esbozos de HLL | |
| Reconocimiento agregado | |
| PDT incrementales | |
| Milisegundos | |
| Microsegundos | |
| Vistas materializadas | |
| Medidas entre períodos | |
| Distinción de recuento aproximado | |
| Modelos analíticos en la base de datos | |
| Calendarios personalizados |
Próximos pasos
Después de completar la conexión de la base de datos, configura las opciones de autenticación.