Melhorar o desempenho do Data Studio

A velocidade com que um relatório do Data Studio é carregado e responde às mudanças do leitor, como a aplicação de filtros ou a mudança do período, depende de vários fatores, entre eles:

  • A performance do conjunto de dados
  • A quantidade de dados consultados pelas visualizações no relatório
  • A complexidade dessas consultas
  • A latência da rede

Alguns desses fatores não podem ser controlados por você (ou pelo Data Studio). Por exemplo, não é possível melhorar a capacidade de resposta da plataforma de dados ou acelerar a conexão de rede. No entanto, você pode fazer alguns ajustes para otimizar a performance do relatório no Data Studio.

Ajustar a taxa de atualização de dados

A maioria dos tipos de fontes tem uma opção de atualização de dados. A exceção são as fontes de dados extraídas. Essa opção permite equilibrar a necessidade de informações atualizadas com a performance do relatório e os possíveis custos ou cotas de consulta. Cada tipo de fonte de dados tem um limite de atualização de dados padrão, mas você pode ajustar conforme necessário. Por exemplo, se você estiver avaliando a performance dos anúncios no seu site ou app, as atualizações diárias de dados podem ser suficientes. Por outro lado, nos relatórios gerados com base em análises de rede social, talvez os dados precisem ser atualizados várias vezes ao dia.

Saiba como gerenciar a atualização de dados.

Usar uma fonte de dados extraída

Uma fonte de dados extraída é um resumo estático de até 100 MB de dados. Depois de criadas, as solicitações de dados do seu relatório vão para esse resumo, não para o conjunto de dados subjacente. O uso de uma fonte de dados extraída pode fazer com que os relatórios e as análises detalhadas sejam carregados com mais rapidez e sejam mais responsivos do que quando se trabalha com uma conexão ativa aos dados.

As fontes de dados extraídas não têm uma opção de atualização de dados. Em vez disso, você pode programar quando quer que as informações na fonte de dados extraídos sejam atualizadas.

Saiba como extrair dados.

Noções básicas sobre simultaneidade e escalonamento

O Data Studio foi projetado com uma arquitetura sem servidor, o que significa que ele não impõe limites rígidos ao número de usuários simultâneos que visualizam relatórios. A performance e o escalonamento são determinados principalmente pela capacidade e capacidade de resposta das fontes de dados subjacentes a que os relatórios se conectam.

Especificidades da fonte de dados

  • BigQuery: ao usar o BigQuery, a simultaneidade e a performance do relatório dependem de fatores como a disponibilidade Slot do BigQuery, a complexidade da consulta, o tamanho dos dados e o armazenamento em cache. Monitore a utilização de slots e a performance de consultas do BigQuery.

    Para otimizar, considere as práticas recomendadas do BigQuery, como particionamento, clustering e uso do BI Engine.

  • Outras fontes de dados: Para outros conectores (por exemplo, Planilhas Google ou bancos de dados de terceiros), os limites de simultaneidade estão sujeitos aos limites de taxa da API do sistema de origem, aos pools de conexão de banco de dados e à capacidade geral de processamento de consultas.

Recomendações úteis

  • Otimizar consultas de fontes de dados: verifique se as consultas são o mais eficientes possível.
  • Aproveitar o armazenamento em cache: use as configurações de atualização de dados do Data Studio para armazenar dados em cache e reduzir consultas diretas à fonte.
  • Implantação gradual: para bases de usuários muito grandes (por exemplo, milhares de usuários), considere uma implantação gradual ao monitorar o impacto na fonte de dados subjacente.
  • Monitorar sistemas subjacentes: verifique a performance e o uso de cotas das suas fontes de dados (por exemplo, slots do BigQuery ou cotas de API).

Melhorias para fontes de dados do BigQuery

As seções a seguir discutem dicas para melhorar a performance em relatórios que usam dados do BigQuery.

Acelerar as fontes de dados do BigQuery com o BI Engine

O BigQuery BI Engine é um serviço rápido de análise na memória. Ao usar o BI Engine, é possível analisar os dados armazenados no BigQuery com tempo de resposta de consulta abaixo de um segundo e alta simultaneidade.

O BI Engine se integra ao Data Studio para acelerar a exploração e a análise de dados. Com o BI Engine, você pode criar painéis e relatórios interativos e avançados no Data Studio sem comprometer o desempenho, a escala, a segurança ou a atualização dos dados.

Primeiros passos ao usar o Data Studio com o BI Engine.

Usar tabelas materializadas para consultas complexas em grandes conjuntos de dados

A conexão do Data Studio a uma visualização do BigQuery pode ser lenta se essa visualização realizar cálculos ou transformações complexas no tempo de execução, especialmente com grandes conjuntos de dados. Embora as visualizações possam ser úteis para reestruturar dados, elas podem levar a tempos limite no Data Studio se realizarem cálculos em tempo real, como gerar dinamicamente URLs assinados para milhões de registros.

Em vez de usar uma visualização que realiza processamento pesado, materialize o resultado da consulta da visualização em uma tabela usando uma destas opções:

Em seguida, conecte o Data Studio à visualização materializada ou tabela em vez da visualização padrão. Isso evita a execução repetida dos cálculos complexos para cada solicitação do Data Studio. Para uma performance ainda mais rápida em dados materializados, use o BI Engine.

Ativar a API BigQuery Storage Read

Para consultas que usam resultados paginados, a ativação da API BigQuery Storage Read pode levar a tempos de consulta aprimorados. O Data Studio usa automaticamente a API Storage Read quando isso melhora os tempos de execução da consulta.

Para ativar a API BigQuery Storage Read, conceda as seguintes permissões ao usuário do BigQuery conectado ao Data Studio:

  • bigquery.readsessions.create
  • bigquery.readsessions.getData