Introdução às visualizações materializadas
As visualizações materializadas são pré-calculadas e armazenam periodicamente os resultados de uma consulta SQL. Em alguns casos de uso, as visualizações materializadas reduzem o tempo total de processamento e os custos relacionados, diminuindo a quantidade de dados a serem verificados em cada consulta. É possível consultar visualizações materializadas como outros recursos de dados.
Benefícios das visualizações materializadas
Os casos de uso a seguir destacam o valor das visualizações materializadas:
- Pré-processar dados. Melhore o desempenho da consulta preparando agregações, filtros, junções e clusters.
- Aceleração de painéis. Capacite ferramentas de BI, como o Looker, que consultam com frequência as mesmas métricas agregadas, por exemplo, usuários ativos diários.
- Análise em tempo real de grandes streams. Pode fornecer respostas mais rápidas em tabelas que recebem dados de streaming de alta velocidade.
- Gerenciamento de custos. Reduzir o custo de consultas repetitivas e caras em grandes conjuntos de dados.
Principais características
As principais características das visualizações materializadas incluem:
- Manutenção zero. O BigQuery pré-calcula as visualizações materializadas em segundo plano quando as tabelas base são alteradas. O BigQuery adiciona automaticamente mudanças incrementais de dados das tabelas de base às visualizações materializadas, sem necessidade de ação do usuário.
- Dados atuais. Visualizações materializadas retornam dados recentes. Se as alterações nas tabelas base puderem invalidar a visualização materializada, o BigQuery vai ler os dados diretamente das tabelas base. Se as mudanças nas tabelas de base não invalidarem a visualização materializada, o BigQuery vai ler o restante dos dados da visualização materializada e ler apenas as mudanças das tabelas de base.
- Ajuste inteligente. Se alguma parte de uma consulta em uma tabela de base puder ser resolvida consultando a visualização materializada, o BigQuery redirecionará a consulta para usar a visualização materializada, melhorando o desempenho e a eficiência. Para saber como e quando o ajuste inteligente pode melhorar as consultas, consulte Usar visualizações materializadas.
Tipos de visualizações materializadas
Há dois tipos básicos de visualizações materializadas:
- As visualizações materializadas incrementais são compatíveis com um conjunto limitado de recursos. Para saber mais sobre a sintaxe SQL compatível com visualizações materializadas, consulte Criar visualizações materializadas. Somente as visualizações materializadas incrementais podem aproveitar o ajuste inteligente.
- Visualizações materializadas não incrementais são compatíveis com a maioria das sintaxes que as incrementais não aceitam.
Por padrão, ao criar visualizações materializadas, o BigQuery só permite criar
visualizações com base em consultas incrementais. Para criar uma visualização não incremental, especifique allow_non_incremental_definition = true na definição da visualização materializada.
O melhor tipo de visualização materializada depende da sua situação. A tabela a seguir compara os recursos das visualizações materializadas incrementais e não incrementais:
| Categoria | Incremental | Não incremental |
|---|---|---|
| Compatibilidade de consulta | Limitado | A maioria das consultas |
| Custo de manutenção | Pode reduzir o custo de consultas usadas com frequência. Para saber como as visualizações materializadas são atualizadas, consulte atualizações incrementais. | Cada atualização executa a consulta completa. |
| Suporte ao ajuste inteligente | Compatível com a maioria das consultas de visualizações. | Não |
| Resultados sempre atualizados | Compatível. As visualizações incrementais retornam resultados de consultas atualizados mesmo quando as tabelas de base foram alteradas desde a última atualização. | Não |
Visualizações materializadas autorizadas
É possível criar uma visualização materializada autorizada para compartilhar um subconjunto de dados de um conjunto de dados de origem com uma visualização em um conjunto de dados secundário. Depois, você pode compartilhar essa visualização com usuários e grupos específicos (principais). Os principais podem consultar os dados fornecidos em uma visualização, mas não podem acessar o conjunto de dados de origem diretamente.
As visualizações autorizadas e materializadas autorizadas são autorizadas da mesma forma. Para mais detalhes, consulte Visualizações autorizadas.
Interação com outros recursos do BigQuery
Os seguintes recursos do BigQuery funcionam de forma transparente com visualizações materializadas:
Explicação do plano de consulta. O plano de consulta mostra quais visualizações materializadas são verificadas (se houver) e quantos bytes são lidos nas visualizações materializadas e nas tabelas base combinadas.
Armazenamento em cache de consultas. Os resultados de uma consulta reescrita pelo BigQuery usando uma visualização materializada podem ser armazenados em cache de acordo com as limitações padrão (uso de funções determinísticas, streaming na tabela base etc).
Restrição de custo. Se você especificar o máximo de bytes cobrados e uma consulta ler dados além desse limite, ela vai falhar sem gerar uma cobrança, seja usando visualizações materializadas, as tabelas de base ou ambas.
Estimativa de custo usando simulação. Uma simulação repete a lógica de reescrever a consulta usando visualizações materializadas disponíveis e fornece uma estimativa de custo. É possível usar esse recurso como forma de testar se uma consulta específica usa visualizações materializadas.
Replicação de dados entre regiões. As visualizações materializadas podem ser criadas em tabelas do BigQuery que têm a replicação entre regiões ativada, mas apenas na região principal. Se você usar a região secundária, poderá encontrar a seguinte mensagem de erro:
The dataset replica of the cross region dataset {PROJECT}:{DATASET} in region {REGION} is read-only because it's not the primary replica.
Além desses recursos, é possível criar visualizações materializadas em tabelas com recursos específicos, conforme descrito nas seções a seguir.
Tabelas com captura de dados alterados ativa
É possível criar visualizações materializadas em tabelas com captura de dados alterados (CDC) ativa. Essas visualizações materializadas funcionam como visualizações materializadas em tabelas do BigQuery, incluindo os benefícios da atualização automática. As visualizações materializadas não podem executar consultas de mesclagem em tempo de execução. Portanto, é necessário configurar as visualizações materializadas com um max_staleness suficiente para evitar jobs de mesclagem em tempo de execução. Para mais informações, consulte
Limitações das visualizações materializadas em tabelas com captura de dados alterados ativa.
Tabelas de metadados ativadas por cache do BigLake
Visualizações materializadas em tabelas de metadados ativadas por cache do BigLake podem referenciar dados estruturados armazenados no Cloud Storage e no Amazon Simple Storage Service (Amazon S3). Essas visualizações materializadas funcionam como as visualizações materializadas em tabelas de armazenamento gerenciadas pelo BigQuery, incluindo os benefícios da atualização automática e do ajuste inteligente. Outros benefícios incluem pré-agregar, pré-filtrar e pré-mesclar dados armazenados fora do BigQuery. As visualizações materializadas nas tabelas do BigLake são armazenadas e têm todas as características do armazenamento gerenciado do BigQuery.
Quando você cria uma visualização materializada em uma tabela do BigLake no Amazon S3, os dados nessa visualização não ficam disponíveis para mesclagens com dados do BigQuery. Para disponibilizar os dados do Amazon S3 em uma visualização materializada para mesclagens, crie uma réplica da visualização materializada. Só é possível criar réplicas de visualizações materializadas em visualizações materializadas autorizadas.
Limitações
As visualizações materializadas estão sujeitas às seguintes limitações:
- Podem ser aplicados limites nas referências da tabela base e outras restrições. Para mais informações sobre limites de visualização materializada, consulte Cotas e limites.
- Não é possível atualizar ou manipular diretamente os dados de visualizações materializadas
usando operações como
COPY,EXPORT,LOAD,WRITEou instruções de linguagem de manipulação de dados (DML). - Não é possível atualizar a consulta de uma visualização materializada depois de criá-la.
- Uma visualização materializada precisa residir na mesma organização da tabela base ou no mesmo projeto, se o projeto não pertencer a uma organização.
- As visualizações materializadas são compatíveis com uma sintaxe SQL restrita e um conjunto limitado de funções de agregação. Para mais informações, consulte Suporte a consultas de visualizações materializadas.
- Não é possível aninhar visualizações materializadas em outras visualizações materializadas.
- As visualizações materializadas não podem consultar tabelas externas ou curinga, visualizações lógicas1 ou snapshots.
- As visualizações materializadas não são compatíveis com variáveis de sistema, por exemplo, a variável de sistema
@@session_id. - O valor da opção
max_stalenessprecisa estar entre 30 minutos e 3 dias, inclusive. - As visualizações materializadas são compatíveis apenas com o dialeto GoogleSQL.
- É possível definir as descrições de visualizações materializadas, mas não para colunas individuais.
- Se você excluir uma tabela base sem excluir primeiro a visualização materializada, as consultas e atualizações da visualização materializada falharão. Se você recriar a tabela base, também precisará recriar a visualização materializada.
- Somente visualizações materializadas não incrementais podem ter tabelas de base de conjuntos de dados externos do Spanner.
Se a última atualização de uma visualização materializada não incremental ocorreu
fora do intervalo
max_staleness, a consulta lê as tabelas do conjunto de dados externo do Spanner. Para saber mais sobre as tabelas de conjuntos de dados externos do Spanner, consulte Criar visualizações materializadas em conjuntos de dados externos do Spanner. - O BigQuery não armazena em cache os resultados de consultas executadas em visualizações materializadas não incrementais que fazem referência a tabelas de conjuntos de dados externos do Spanner.
- As visualizações materializadas não podem herdar nem definir explicitamente tipos de dados parametrizados, como
STRING(n), porque eles só são compatíveis com colunas de tabelas de base e variáveis de script.
1O suporte à referência de visualização lógica está em pré-lançamento. Para mais informações, consulte Referência a visualizações lógicas.
Limitações das visualizações materializadas em tabelas com CDC ativo
As visualizações materializadas com tabelas de base de captura de dados alterados ativa têm as seguintes limitações:
- Se uma visualização materializada tiver uma tabela base com captura de dados alterados ativa, não será possível referenciar essa tabela em uma consulta que também faça referência à visualização materializada.
- Quando você cria uma visualização materializada em uma tabela com captura de dados alterados ativa, a visualização materializada não pode executar os jobs de mesclagem de tempo de execução da tabela de CDC subjacente.
Defina o valor
max_stalenessda visualização materializada como pelo menos o dobro do valormax_stalenessda tabela de base. As consultas em uma visualização materializada falham se a versão atual da tabela de CDC subjacente for mais antiga que a visualização materializadamax_staleness. - Não é possível usar o ajuste inteligente para visualizações materializadas em tabelas com captura de dados de mudança ativa.
Limitações de visualizações materializadas em tabelas do BigLake
As visualizações materializadas em tabelas do BigLake têm as seguintes limitações:
- Não é possível particionar a visualização materializada. As tabelas base podem usar o particionamento do Hive, mas não é possível particionar o armazenamento de visualizações materializadas em tabelas do BigLake. Isso significa que qualquer exclusão em uma tabela base causa uma atualização completa da visualização materializada. Para mais detalhes, consulte Atualizações incrementais.
- O valor de opção
--max_stalenessda visualização materializada precisa ser maior que o valor da tabela base do BigLake. - Não é possível fazer uma junção entre tabelas gerenciadas do BigQuery e tabelas do BigLake em uma única definição de visualização materializada.
- O BigQuery BI Engine não oferece suporte à aceleração de visualizações materializadas em tabelas do BigLake.
Preços de visualizações materializadas
As visualizações materializadas geram custos das seguintes maneiras:
- Como consultar visualizações materializadas
- Como manter visualizações materializadas, como quando são atualizadas. O custo da atualização automática é cobrado no projeto em que a visualização reside. O custo da atualização manual é cobrado no projeto em que o job de atualização manual é executado. Para mais informações sobre como controlar o custo de manutenção, consulte Manutenção do job de atualização.
- Como armazenar tabelas de visualização materializadas.
A tabela a seguir descreve os componentes de preços das visualizações materializadas:
| Componente | Preços sob demanda | Preços baseados em capacidade |
|---|---|---|
| Consulta | Bytes processados por visualizações materializadas e quaisquer partes necessárias das tabelas base.1 | Slots são consumidos durante o tempo de consulta. |
| Manutenção | Bytes processados durante o tempo de atualização. | Slots são consumidos durante o tempo de atualização. |
| Armazenamento | Bytes armazenados em visualizações materializadas. | Bytes armazenados em visualizações materializadas. |
1 Sempre que possível, o BigQuery lê apenas as alterações desde a última vez em que a visualização foi atualizada. Veja mais informações em Atualizações incrementais.
Detalhes do custo de armazenamento
A maneira como o BigQuery armazena determinados valores agregados afeta o cálculo do tamanho do armazenamento. Para valores agregados AVG, ARRAY_AGG e APPROX_COUNT_DISTINCT em uma visualização materializada, o valor final não é armazenado diretamente. Em vez disso,
o BigQuery armazena internamente uma visualização materializada como um
rascunho intermediário, que é usado para produzir o valor final.
Por exemplo, considere uma visualização materializada criada com o seguinte comando:
CREATE MATERIALIZED VIEW project-id.my_dataset.my_mv_table AS SELECT date, AVG(net_paid) AS avg_paid FROM project-id.my_dataset.my_base_table GROUP BY date
Enquanto a coluna avg_paid aparece como NUMERIC ou FLOAT64,
internamente ela é armazenada como BYTES, com seu conteúdo como um rascunho intermediário
em um formato reservado. Para o cálculo do tamanho dos dados, a
coluna é tratada como BYTES.
A seguir
- Visão geral das visualizações lógicas e materializadas
- Criar visualizações materializadas
- Usar visualizações materializadas
- Gerenciar visualizações materializadas