Conéctate a Google BigQuery

BigQuery es el almacén de datos de estadísticas de bajo costo, completamente administrado y con escala de petabytes de Google. El conector de BigQuery de Data Studio te permite acceder a los datos de tus tablas de BigQuery dentro de Data Studio.

Antes de comenzar

Para acceder a los datos de BigQuery en Data Studio, deberás proporcionar una cuenta de Facturación de Google Cloud. BigQuery es un producto pago, por lo que se generarán costos de uso cuando accedas a él a través de Data Studio. Más información sobre los precios de BigQuery.

Cómo conectarse a BigQuery

Puedes conectar Data Studio a una tabla, una vista o una consulta personalizada en Google BigQuery.

Pasos para conectarse

  1. Accede a Data Studio.

  2. Haz clic en Crear y, luego, selecciona Informe.

  3. Aparecerá el editor de informes y se abrirá el panel Agregar datos al informe.

  4. Para crear una nueva fuente de datos incorporada, selecciona el BigQuery BigQuery.

    1. Para seleccionar una fuente de datos reutilizable existente, haz clic en la pestaña Mis fuentes de datos y, luego, selecciona una fuente de datos de cualquier tipo que hayas creado anteriormente o que se haya compartido contigo.
  5. Configura la conexión de la fuente de datos a tus datos de BigQuery. Puedes conectarte a una tabla o vista de BigQuery, o bien usar una consulta en SQL personalizada.

  6. Haz clic en Agregar.

En un momento, aparecerá en el lienzo del informe una tabla conectada a la fuente de datos.

Explicación de las fuentes de datos incorporadas y reutilizables

Las fuentes de datos pueden ser incorporadas o reutilizables. Los informes pueden incluir fuentes de datos incorporadas y reutilizables.

Las fuentes de datos que creas mientras editas un informe se incorporan en el informe. Para editar una fuente de datos incorporada, debes hacerlo en ese informe. Las fuentes de datos incorporadas facilitan la colaboración en informes y fuentes de datos. Cualquier persona que pueda editar el informe también puede editar la fuente de datos y modificar su conexión. Cuando compartes o copias el informe, las fuentes de datos incorporadas también se comparten o copian.

Las fuentes de datos que creas desde la página principal son reutilizables. Puedes reutilizar estas fuentes de datos en diferentes informes. Las fuentes de datos reutilizables te permiten crear y compartir un modelo de datos coherente en toda tu organización. Solo las personas con las que compartes la fuente de datos reutilizable pueden editarla. Solo el propietario de las credenciales de la fuente de datos puede modificar la conexión.

Obtén más información sobre las fuentes de datos.

¿Es la primera vez que usas Data Studio?

Usa el panel de propiedades para cambiar los datos y el estilo de la tabla. Usa la barra de herramientas para agregar más gráficos, controles y otros componentes a tu informe.

Conéctate a una tabla o vista de BigQuery

Una tabla de BigQuery contiene registros individuales organizados en filas. Cada registro se compone de columnas (también llamadas campos ). Una vista de BigQuery es una tabla virtual definida por una consulta en SQL que se ejecuta en la consola de BigQuery.

Para conectarte a una tabla o vista, deberás proporcionar la siguiente información:

  • Un proyecto de BigQuery
  • Un conjunto de datos
  • Una tabla o vista

Proyecto

Los proyectos organizan tus recursos de BigQuery y proporcionan la información necesaria para la facturación si tus informes superan las cuotas gratuitas de BigQuery. Puedes usar el mismo proyecto para la facturación y la administración de datos, o bien usar un proyecto para los datos y facturar otro. Obtén más información sobre los proyectos de Google Cloud.

Elige una de las siguientes opciones para seleccionar tu proyecto:

  • PROYECTOS RECIENTES
  • MIS PROYECTOS
  • PROYECTOS COMPARTIDOS

Proyectos recientes

La opción PROYECTOS RECIENTES te muestra los proyectos a los que accediste recientemente en la Google Cloud consola. También puedes ingresar el ID del proyecto de forma manual. El proyecto que elijas se usará para la facturación y el acceso a los datos. Después de seleccionar un proyecto, elegirás un conjunto de datos.

Mis proyectos

La opción MIS PROYECTOS te permite seleccionar cualquier proyecto al que tengas acceso. También puedes ingresar el ID del proyecto de forma manual. El proyecto que elijas se usará para la facturación y el acceso a los datos. Después de seleccionar un proyecto, elegirás un conjunto de datos.

Si tienes acceso a muchos proyectos, es posible que no aparezcan todos en la lista. Cuando la lista supera la cantidad máxima de elementos, puedes ingresar el proyecto no incluido directamente escribiéndolo en el campo de entrada.

Proyectos compartidos

La opción PROYECTOS COMPARTIDOS te permite acceder a un proyecto que se compartió contigo. Puedes seleccionar diferentes proyectos para los datos y la facturación.

Conjuntos de datos

Los conjuntos de datos se usan para organizar y controlar el acceso a tus datos. Selecciona un conjunto de datos de la lista o busca uno por su nombre.

Conjuntos de datos públicos

Los conjuntos de datos públicos de BigQuery son muestras públicas en las que se comparte el conjunto de datos, pero no el proyecto. Para consultar estos datos, debes especificar tu propio proyecto de facturación, que se usará para facturar los costos de procesamiento de los datos compartidos.

Tabla

Puedes conectar una fuente de datos de Data Studio a una sola tabla o vista.

Conéctate a una tabla particionada por fecha

Data Studio puede aprovechar las tablas particionadas por fecha de BigQuery. Cuando te conectas a una tabla que está particionada en un campo DATE, DATETIME o TIMESTAMP, Data Studio puede usar ese campo como la dimensión de período para los gráficos basados en esta fuente de datos.

Obtén más información para conectar Data Studio a tablas particionadas por fecha de BigQuery.

Conéctate a BigQuery con una consulta en SQL personalizada

La opción CONSULTA PERSONALIZADA te permite conectarte a tus datos escribiendo código SQL. La sintaxis de la consulta personalizada sigue el dialecto de SQL estándar. Para usar el dialecto de SQL heredado de BigQuery, selecciona la opción Usar SQL heredado.

Usa la interfaz de usuario de BigQuery para redactar y probar tu consulta. Luego, copia y pega esa consulta en el cuadro de consulta personalizada de Data Studio.

Proyecto de facturación

La opción Proyecto de facturación te permite proporcionar un proyecto de facturación para tu consulta personalizada. Para ello, busca el ID del proyecto o ingrésalo de forma manual. Si tu organización tiene muchos proyectos de BigQuery, es posible que debas usar el método de entrada manual para ubicar el proyecto.

Para usar un proyecto para la facturación y otro diferente para tus datos, selecciona o ingresa el proyecto de facturación en la interfaz de usuario y, luego, incluye el proyecto de datos en la cláusula SELECT...FROM de la consulta personalizada.

Ejemplo de una configuración de consulta personalizada de BigQuery, con el proyecto de facturación establecido en el proyecto de Looker Studio, mientras que la consulta especifica un conjunto de datos públicos de BigQuery en la cláusula FROM de la consulta.

Parámetros de consulta

Los parámetros te permiten crear informes más responsivos y personalizables. Puedes pasar parámetros en una fuente de datos de BigQuery a la consulta subyacente. Para usar un parámetro en tu consulta personalizada, sigue los lineamientos de sintaxis para ejecutar consultas con parámetros en BigQuery.

Obtén más información para usar parámetros en consultas personalizadas.

Límites de las consultas personalizadas

Data Studio usa tu SQL personalizado como una instrucción SELECT interna para cada consulta generada a la base de datos. En efecto, tu consulta personalizada genera una tabla virtual nueva que Data Studio consulta con su propio SQL "externo" generado. Por este motivo, las consultas personalizadas en Data Studio están sujetas a las siguientes restricciones:

Las consultas en SQL personalizadas solo pueden tener una instrucción

Por ejemplo, lo siguiente no funcionará porque tiene varias instrucciones en SQL:


DECLARE cost_per_tb_in_dollar FLOAT64 DEFAULT 4.2;

SELECT total_bytes_billed / (1024 * 1024)* cost_per_tb_in_dollar)/(1024*1024))) FROM billing-table;

Usa nombres de campo inequívocos en las uniones

Las consultas de unión personalizadas no pueden controlar nombres de columnas duplicados. Los gráficos que usan una fuente de datos basada en una consulta personalizada que incluye campos duplicados mostrarán un error de configuración del usuario similar al siguiente:

Texto del mensaje de error: Error de configuración del usuario

Para evitar este problema, asegúrate de usar nombres de campo inequívocos en tus consultas personalizadas.

Por ejemplo, supongamos que unes dos tablas con esquemas idénticos en un campo Criteria_ID que se encuentra en ambas tablas.


    SELECT * FROM (
          SELECT Criteria_ID, Parent_ID, Name FROM 'table_1'
            ) As table_1
          LEFT JOIN (
            SELECT Criteria_ID, Parent_ID, Name FROM 'table_2'
            ) As table_2
          ON
            table_1.Criteria_ID = table_2.Criteria_ID

Esta consulta incluye los siguientes nombres de columnas duplicados:

  • Criteria_ID
  • Parent_ID
  • Name

Para evitar el error Field is ambiguous, puedes cambiar el nombre de los campos duplicados de forma explícita con la palabra clave AS:


    SELECT *
          FROM (
            SELECT
              Criteria_ID AS Criteria_ID_1,
              Parent_ID AS Parent_ID_1,
              Name AS NAME_1
           FROM
             'table_1' ) AS table_1
           LEFT JOIN (
             SELECT
               Criteria_ID AS Criteria_ID_2,
               Parent_ID AS Parent_ID_2,
               Name AS NAME_2
             FROM
               'table_2' ) AS table_2
             ON
               table_1.Criteria_ID_1 = table_2.Criteria_ID_2;

Si solo necesitas cambiar el nombre de algunos campos, puedes seleccionar todo, excepto los que deseas cambiar de nombre, por ejemplo:


SELECT * EXCEPT (city), city AS city_1 FROM 'table_1'

Se agota el tiempo de espera de la consulta

Es posible que las consultas personalizadas en Data Studio se agoten después de tres a cinco minutos. Si se agotan tus consultas personalizadas, prueba los siguientes enfoques para resolver el problema:

  • Simplifica la consulta para que se ejecute más rápido.
  • Ejecuta la consulta en tu base de datos y almacena los resultados en una tabla separada. Luego, conéctate a esa tabla en tu fuente de datos.

Tablas de varios días

BigQuery admite la consulta en varias tablas, en las que cada tabla tiene un solo día de datos. Las tablas tienen el formato YYYYMMDD. Cuando Data Studio encuentra una tabla con el formato YYYYMMDD, se marcará como una tabla de varios días y solo se mostrará el prefijo de nombre_AAAAMMDD en la selección de tabla.

Cuando se crea un gráfico para visualizar esta tabla, Data Studio creará automáticamente un período predeterminado de los últimos 28 días y, luego, consultará correctamente las últimas 28 tablas. Para configurar este parámetro, edita el informe, selecciona el gráfico y, luego, ajusta las propiedades de Período en la pestaña DATOS del gráfico.

Consulta el SQL emitido a BigQuery

Puedes ver todo el SQL de BigQuery que generó Data Studio desde la interfaz de usuario del historial de consultas de BigQuery.

Métrica Record Count

Las fuentes de datos de BigQuery proporcionan automáticamente una métrica Record Count predeterminada. Puedes usarla para desglosar tus dimensiones y mostrar la cantidad de registros que agregan tus gráficos.

Compatibilidad con los Controles del servicio de VPC

Data Studio puede conectarse a proyectos de BigQuery protegidos por perímetros de los Controles del servicio de VPC (VPC-SC) a través de niveles de acceso basados en la IP del visualizador. El conector de BigQuery pasa la dirección IP del visualizador del informe a BigQuery, que puede aplicar los niveles de acceso basados en la IP que se hayan configurado.

Visualiza polígonos de GEOGRAPHY de BigQuery

Puedes mostrar polígonos de GEOGRAPHY con una visualización de Google Maps en tu informe. Consulta Visualiza polígonos de GEOGRAPHY de BigQuery con Data Studio para ver un tutorial.

Analiza las consultas de Data Studio con etiquetas de trabajo

Todas las consultas que Data Studio envía a BigQuery tienen la etiqueta de trabajo de BigQuery requestor:looker_studio. Puedes usar esta etiqueta de trabajo para identificar las consultas de BigQuery relacionadas con Data Studio.Para obtener más información sobre las etiquetas en BigQuery, consulta la página de documentación Visualiza etiquetas de BigQuery.

Si eres el propietario de la fuente de datos de BigQuery, también puedes ver los detalles del trabajo haciendo clic en el ícono Con tecnología de BigQuery.

Para obtener más información sobre el seguimiento del rendimiento y el costo de los gráficos y los informes de Data Studio, consulta la página de documentación Analiza datos con BigQuery de Data Studio.

Diálogo de BigQuery

Si tienes credenciales de propietario en la fuente de datos de BigQuery, Data Studio mostrará un ícono de BigQuery en la esquina superior derecha de cualquier gráfico que use BigQuery. Coloca el cursor sobre el gráfico y, luego, haz clic en el ícono de BigQuery para abrir el diálogo BigQuery. El diálogo muestra un vínculo a la página de detalles del trabajo de BigQuery. La página de detalles del trabajo de BigQuery incluye la siguiente información:

  • La consulta en SQL para el gráfico
  • Los datos que mostró la consulta en SQL
  • Un desglose por etapa de los pasos de la consulta
  • Estadísticas de la consulta, como el tiempo de ejecución total y las ranuras usadas

Mejora el rendimiento con la API de BigQuery Storage Read

Para las consultas que usan resultados paginados, habilitar la API de BigQuery Storage Read puede mejorar los tiempos de consulta. Data Studio usa automáticamente la API de Storage Read cuando esto mejora los tiempos de ejecución de las consultas.

Para habilitar la API de BigQuery Storage Read, otorga los siguientes permisos a tu usuario de BigQuery conectado a Data Studio:

  • bigquery.readsessions.create
  • bigquery.readsessions.getData

Cuotas y límites generales

En general, las fuentes de datos de BigQuery están sujetas a los mismos límites de frecuencia y cuota que BigQuery.

Cantidad máxima de filas

La cantidad máxima de filas que se pueden mostrar con el conector de BigQuery es de 2 millones. Data Studio indicará cuándo hay más de 2 millones de filas de datos, pero no especificará la cantidad.

Cantidad máxima de tablas

Para las conexiones de BigQuery, hay un límite de 5,000 tablas por conjunto de datos cuando se usa el conector de Data Studio. Si se supera este límite, es posible que la IU deje de responder cuando Data Studio cargue la lista de tablas del conjunto de datos.

Si alcanzas este límite, puedes usar una de las siguientes soluciones alternativas:

  • Usa una consulta personalizada: Conéctate a BigQuery con una consulta en SQL personalizada en lugar de conectarte a una tabla. Por ejemplo: SELECT * FROM project.dataset.table.
  • Conéctate desde BigQuery: En la consola de BigQuery, usa las opciones Exportar o Explorar datos y, luego, selecciona Abrir con Looker Studio.
  • Administra conjuntos de datos: Reorganiza las tablas en conjuntos de datos más pequeños con menos de 5,000 tablas o crea un conjunto de datos de informes dedicado con solo las tablas o vistas necesarias.

Funciones MEDIAN y PERCENTILE

Para las fuentes de datos de BigQuery, MEDIAN y PERCENTILE se implementan con la función APPROX_QUANTILES de BigQuery. Aplicar MEDIAN o PERCENTILE a los datos de BigQuery puede mostrar resultados ligeramente diferentes que aplicar MEDIAN o PERCENTILE a los mismos datos de otros tipos de fuentes de datos.

Claves de encriptación administradas por el cliente (CMEK)

El conector de BigQuery no admite claves de encriptación administradas por el cliente (CMEK). Si tu Google Cloud proyecto está sujeto a una política de la organización que requiere CMEK, Data Studio no puede consultar los datos y muestra un error CONDITION_NOT_MET.

Tipo de datos TIME

Data Studio no admite el tipo de datos TIME de BigQuery. Cualquier campo TIME de tu conjunto de datos se convierte en campos TEXT en Data Studio. Para visualizar datos de tiempo en tus informes, puedes usar una de las siguientes soluciones alternativas para convertir los datos TIME en un tipo de datos DATETIME:

Solución alternativa 1: Usa una consulta personalizada

Usa una consulta personalizada de BigQuery como fuente de datos en Data Studio. Combina el campo TIME con una fecha "ficticia" para crear un valor DATETIME compatible con Data Studio.

Consulta en SQL personalizada

SELECT
  *,
  -- Combine a dummy date (1970-01-01) with your TIME field
  DATETIME(DATE "1970-01-01", your_time_field) AS time_as_datetime
FROM
  `your_project.your_dataset.your_table`
  • Resultado: Data Studio trata time_as_datetime como un tipo de datos Fecha y hora.
  • Personalización: Para ocultar la fecha ficticia y mostrar solo la parte de la hora, en tu informe, edita el Formato de visualización del campo time_as_datetime y selecciona un formato, como Hora o Minuto, o proporciona un formato personalizado, como h:mm:ss. Obtén más información sobre los formatos de visualización de campos.

Solución alternativa 2: Usa un campo calculado

Si no quieres cambiar tu consulta en SQL, puedes controlar la conversión directamente en Data Studio con un campo calculado. En este ejemplo, se supone que el campo TIME de BigQuery contiene datos en formato "hora:minuto:segundo" (por ejemplo, 23:59:59).

Fórmula del campo calculado

PARSE_DATETIME("%H:%M:%S", CAST(your_time_field AS TEXT))
  • Resultado: La función PARSE_DATETIME convierte la cadena en un objeto Fecha y hora. La función CAST garantiza que your_time_field se trate como TEXT. Como no se especifica ninguna fecha en la cadena, Data Studio establece automáticamente la parte de la fecha como 1 de enero de 1970. Obtén más información sobre la función PARSEDATE.
  • Personalización: Al igual que en la solución alternativa de consulta personalizada, puedes cambiar el Formato de visualización del campo en la pestaña Configuración del gráfico para asegurarte de que solo aparezca la información de hora pertinente en tus gráficos.