Conceptos de SQL para las uniones

Al igual que en SQL, una unión en LookML se usa para combinar filas de dos o más tablas, según una columna relacionada entre ellas.

En LookML, una exploración, definida por el parámetro de LookML explore, se usa para definir cómo un usuario puede consultar los datos. Una exploración consta de al menos una vista o un conjunto de vistas unidas. La vista principal de Explorar siempre se incluye en la consulta. Por lo general, las vistas unidas solo se incluyen si son necesarias para satisfacer la consulta.

Una vista de LookML corresponde a una tabla de SQL (o a otro elemento que tenga la estructura de una tabla) en la base de datos, o a una tabla derivada. La vista define qué campos o columnas están disponibles en la base de datos y cómo se debe acceder a ellos.

El siguiente ejemplo es una definición de la función Explorar de orders.

explore: orders {
  join: users {
    type: left_outer
    sql_on: ${orders.user_id} = ${users.id} ;;
    relationship: many_to_one
  }
}

La vista orders, que es la vista principal en la Exploración, se une a la vista users con un SQL LEFT OUTER JOIN, como lo indica el parámetro type: left_outer de LookML. La cláusula SQL ON, que se define con el parámetro de LookML sql_on, no usa table_alias.column, sino que hace referencia a to ${view_name.field_name}. Esto se hace para que, si el nombre de la tabla o de la columna cambia en la base de datos, ese cambio solo se tenga que realizar en un lugar.

El parámetro relationship es importante. Las uniones pueden causar problemas de fanout, en los que se duplican las filas. Cuando especificas que muchos pedidos se unirán a un solo usuario, Looker reconoce que no se producirán fanouts a partir de esta unión, por lo que no se necesita un tratamiento especial. Sin embargo, las relaciones one_to_many pueden activar una expansión.

La generación automática de vistas y Explorar se establece de forma predeterminada en una combinación externa izquierda. Sin embargo, en el ejemplo anterior, es muy probable que cada pedido tenga exactamente un usuario, por lo que la unión en este ejemplo puede ser una unión interna.

Para ver el código SQL generado de una exploración, puedes ejecutar la exploración en la IU y, luego, seleccionar la pestaña SQL en el panel Datos.

Por ejemplo, si abres el Explorador Pedidos, que se definió anteriormente, y, luego, seleccionas los campos ID de usuario y Recuento, el SQL generado se verá de la siguiente manera:

SELECT
    `user_id` AS `orders.user_id`,
    COUNT(*) AS `orders.count`
FROM
    `thelook`.`orders` AS `orders`
GROUP BY
    1
ORDER BY
    2 DESC
LIMIT 500

En este ejemplo, no se hace referencia a la tabla de usuarios. Solo se importa si es necesario.

Si quitas la dimensión ID de usuario y agregas la dimensión ID de la vista Usuarios, la instrucción SQL se verá de la siguiente manera:

SELECT
    `users`.`id` AS `users.id`,
    COUNT(*) AS `orders.count`
FROM
    `thelook`.`orders` AS `orders`
    INNER JOIN `thelook`.`users` AS `users` ON `orders`.`user_id` = `users`.`id`
GROUP BY
    1
ORDER BY
    2 DESC
LIMIT 500

En este caso, como hay una selección de la vista Users, se incluye la unión.

En el siguiente ejemplo, se muestra LookML en el archivo de Explorar orders, que se definió anteriormente, y se agrega una combinación a la vista order_items:

explore: orders {
  join: users {
    type: inner
    sql_on: ${orders.user_id} = ${users.id} ;;
    relationship: many_to_one
  }
  join: order_items {
    type: inner
    sql_on: ${orders.id} = ${order_items.order_id} ;;
    relationship: one_to_many
  }
}

Ahora, si abres la exploración Pedidos en la IU, verás la vista Artículos del pedido. Si seleccionas la medición Total Sale Price de la vista Order Items junto con el recuento de Pedidos y el ID de Usuarios, Looker generará el siguiente código SQL:

SELECT
    `users`.`id` AS `users.id`,
    COUNT(DISTINCT orders.id ) AS `orders.count`,
    COALESCE(SUM(`order_items`.`sale_price`), 0) AS `order_items.total_sale_price`
FROM
    `thelook`.`orders` AS `orders`
    INNER JOIN `thelook`.`users` AS `users` ON `orders`.`user_id` = `users`.`id`
    INNER JOIN `thelook`.`order_items` AS `order_items` ON `orders`.`id` = `order_items`.`order_id`
GROUP BY
    1
ORDER BY
    2 DESC
LIMIT 500

En este ejemplo, COUNT(*) AS orders.count se convirtió en COUNT(DISTINCT orders.id ) AS orders.count. Looker detectó que había una posible situación de fanout y agregó automáticamente la palabra clave SQL DISTINCT a la función SQL COUNT.