Como funcionam as misturas no Data Studio

A mistura de dados permite-lhe criar gráficos, tabelas e controlos com base em várias origens de dados. Pode combinar dados de até cinco origens de dados no Data Studio ou em relatórios do Looker.

Por exemplo, pode misturar dados de diferentes tabelas do BigQuery, como informações de clientes e detalhes de encomendas, e visualizar essas informações numa única tabela do Data Studio. Como outro exemplo, pode traçar dados combinados das suas contas do Google Ads e do Google Analytics numa série cronológica para ver uma vista unificada do desempenho da sua campanha de marketing.

Diferenças entre misturas e origens de dados

A mistura de dados cria um recurso conhecido como mistura. As misturas são semelhantes às origens de dados, uma vez que fornecem dados para gráficos e controlos no seu relatório. No entanto, as combinações diferem das origens de dados de algumas formas importantes:

  • As misturas obtêm as respetivas informações de várias origens de dados.
  • As combinações são sempre incorporadas no relatório em que são criadas. Não pode tornar uma combinação reutilizável em vários relatórios. No entanto, se copiar o relatório, as combinações são copiadas para o novo relatório, pelo que os gráficos continuam a funcionar com os dados combinados.
  • As métricas na origem de dados subjacente tornam-se dimensões numéricas não agregadas na combinação. Consulte a página de documentação Sugestões de combinação e conceitos avançados para mais informações.
  • As misturas não têm definições de atualização de dados nem de credenciais próprias. Em alternativa, estas definições são herdadas das origens de dados subjacentes.

Como funcionam as combinações

Os programadores de bases de dados usam declarações de junção SQL para misturar dados de diferentes tabelas. No Data Studio, pode combinar dados sem escrever código. Em alternativa, usa o editor de mistura para configurar a junção, conforme mostrado na captura de ecrã seguinte:

O editor de mistura apresenta opções de mistura que aparecem quando seleciona opções de tabelas e campos.

Legenda:

  1. Tabelas
  2. Configuração da união
  3. Botão Unir outra tabela
  4. Nome da mistura
  5. Dimensões e métricas incluídas
  6. Adicione métricas, um intervalo de datas e filtros
  7. Opção Ocultar campos de união repetidos e botão GUARDAR

Tabelas

As combinações são compostas por tabelas. Quando edita ou cria uma combinação, vê as respetivas tabelas apresentadas na IU. Cada tabela contém um conjunto de campos que são extraídos da origem de dados subjacente. Uma combinação pode ter até cinco tabelas.

Antes de as tabelas serem unidas, o Data Studio agrupa e agrega linhas em cada tabela com base nas dimensões incluídas nessa tabela. Se as dimensões que selecionar não incluírem um identificador único para cada registo, as linhas idênticas são reduzidas durante esta fase de pré-agrupamento. Esta redução pode resultar num número de linhas inferior ao que pode obter se executar uma consulta de união SQL diretamente nos mesmos dados. Para evitar que as linhas sejam reduzidas prematuramente, adicione um campo de identificador único (como uma chave primária ou um ID de linha único) à lista de dimensões de cada tabela na combinação.

Para adicionar dados a uma tabela, clique em Adicionar dimensão ou Adicionar métrica.

Os campos usados nas condições de junção são apresentados com um ícone de link Ícone de link usado para mostrar campos numa condição de junção..

Configuração da união

Uma configuração de junção associa pares de tabelas numa mistura. Uma configuração de junção consiste num operador, que define como combinar registos correspondentes e não correspondentes dessas tabelas, e numa condição, que é um conjunto de campos que define como as tabelas estão relacionadas entre si.

Por exemplo, na captura de ecrã seguinte, a tabela Notas junta-se à tabela Alunos no campo student_id e à tabela Turmas no campo class_id. Ambas as configurações de união usam o operador externo esquerdo.

A configuração de junção com um operador de junção externa à esquerda selecionado com as condições de junção definidas entre os campos student_id (Notas) e student_id (Alunos).

Operadores de união

O operador de junção determina como as linhas correspondentes e não correspondentes das tabelas na combinação são unidas. O Data Studio é compatível com os seguintes operadores de junção:

  • Junção interna: devolve apenas linhas correspondentes das tabelas esquerdas e direitas.
  • Junção externa esquerda: devolve linhas correspondentes da tabela direita, bem como linhas não correspondentes das tabelas esquerdas.
  • Junção externa direita: devolve linhas correspondentes das tabelas esquerdas, bem como linhas não correspondentes da tabela direita.
  • Junção externa completa: devolve todas as linhas correspondentes das tabelas esquerdas ou da tabela direita.
  • Junção cruzada: devolve todas as combinações possíveis de linhas das tabelas esquerdas e direitas.

Saiba mais acerca dos operadores de junção na documentação do BigQuery.

Condições de junção

Uma condição de junção é um campo ou campos que podem ser encontrados em cada tabela e que podem ser usados para associar os registos dessas tabelas. Por exemplo, numa combinação de gráficos do Google Analytics e do Google Ads, se o Nome da campanha existir em ambas as tabelas extraídas, o Data Studio pode usar esse campo para juntar os dados.

Para cada tabela na mistura, seleciona os campos a usar na condição. Tenha em atenção que não tem de usar os mesmos campos para todas as tabelas, nem os campos têm de ter os mesmos nomes, desde que os dados em cada campo sejam os mesmos. Por exemplo, suponhamos que quer visualizar clientes, encomendas e artigos num único gráfico. Estas tabelas podem ter os seguintes campos:

Tabela Clientes

  • customer_ID
  • customer_name

Tabela Encomendas

  • cust_id
  • order_number
  • order_total

Tabela Itens

  • order_number
  • SKU

Para misturar estas tabelas, junta a tabela Clientes à tabela Encomendas através dos campos customer_ID e cust_id como condição de junção, e junta a tabela Encomendas à tabela Artigos através de order_number como condição de junção.

Dimensões e métricas incluídas

Todos os campos usados nas condições de junção da combinação, além de quaisquer dimensões ou métricas adicionais que adicione à combinação, são apresentados na secção Dimensões e métricas incluídas. Estes são os campos que pode usar em quaisquer gráficos baseados na combinação.

Oculte campos de união repetidos

A opção Ocultar campos de união repetidos exclui campos duplicados que são usados em condições de união. Para incluir campos de união repetidos, desmarque esta opção.

Por exemplo, suponhamos que está a juntar três tabelas: Notas, Alunos e Turmas, usando os campos student_id e class_id na configuração da união. Com a opção Ocultar campos de união repetidos selecionada, a combinação inclui apenas uma instância de student_id e class_id.

Uma combinação das tabelas de notas, alunos e turmas, incluindo apenas um campo student_id e apenas um campo class_id.

Para a mesma configuração de mistura, com a opção Ocultar campos de junção repetidos desmarcada, a mistura inclui agora várias instâncias destudent_id e class_id, juntamente com o nome da tabela em que esse campo aparece, por exemplo, class_id (Classificações), class_id (Turmas), student_id (Classificações) e student_id (Alunos).

Uma combinação das tabelas de notas, alunos e turmas, incluindo vários campos student_id e vários campos class_id.

Intervalos de datas e filtros

Pode limitar os dados na combinação aplicando um intervalo de datas ou um filtro a uma ou mais tabelas.

Exemplo de combinação

O exemplo de mistura de turmas, alunos e classificações demonstra como resolver um exemplo de utilização clássico de mistura de dados.