Monitorar consultas contínuas
É possível monitorar as consultas contínuas do BigQuery usando as seguintes ferramentas do BigQuery:
- Visualizações
INFORMATION_SCHEMA
- Gráficos de execução de consulta
- Histórico de jobs
- Análise de jobs administrativos
Devido à natureza de longa duração das consultas contínuas do BigQuery, métricas que geralmente são geradas após a conclusão de uma consulta SQL podem estar ausentes ou imprecisas.
Usar visualizações INFORMATION_SCHEMA
É possível usar várias visualizações INFORMATION_SCHEMA
para monitorar
consultas contínuas e reservas de consulta contínuas.
Mais detalhes do job
Você pode usar a visualização
JOBS
para receber
metadados dos jobs de consulta contínuos.
A consulta a seguir retorna os metadados de todas as consultas contínuas ativas. Os metadados incluem o carimbo de data/hora da marca d'água de saída, que representa o ponto até o qual a consulta contínua processou dados com sucesso.
No console Google Cloud , acesse a página BigQuery.
No Editor de consultas, execute esta consulta:
SELECT start_time, job_id, user_email, query, state, reservation_id, continuous_query_info.output_watermark FROM `PROJECT_ID.region-REGION.INFORMATION_SCHEMA.JOBS` WHERE creation_time > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 day) AND continuous IS TRUE AND state = "RUNNING" ORDER BY start_time DESC
Substitua:
PROJECT_ID
: o ID do projeto.REGION
: qualquer nome da região do conjunto de dados. Por exemplo,region-us
.
Ver detalhes da atribuição de reserva
Você pode usar as visualizações
ASSIGNMENTS
e
RESERVATIONS
para receber
detalhes da atribuição de reserva de consulta contínua.
Retorne detalhes de atribuição de reserva para consultas contínuas:
No console Google Cloud , acesse a página BigQuery.
No Editor de consultas, execute esta consulta:
SELECT reservation.reservation_name, reservation.slot_capacity FROM `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.ASSIGNMENTS` AS assignment INNER JOIN `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.RESERVATIONS` AS reservation ON (assignment.reservation_name = reservation.reservation_name) WHERE assignment.assignee_id = 'PROJECT_ID' AND job_type = 'CONTINUOUS';
Substitua:
ADMIN_PROJECT_ID
: o ID do projeto de administração que contém a reserva.LOCATION
: o local da reserva.PROJECT_ID
: o ID do projeto atribuído à reserva. Somente informações sobre consultas contínuas em execução neste projeto são retornadas.
Ver informações de consumo de slots
Você pode usar as visualizações
ASSIGNMENTS
,
RESERVATIONS
e
JOBS_TIMELINE
para receber
informações de consumo do slot de consulta contínua.
Retorna informações de consumo de slots para consultas contínuas:
No console Google Cloud , acesse a página BigQuery.
No Editor de consultas, execute esta consulta:
SELECT jobs.period_start, reservation.reservation_name, reservation.slot_capacity, SUM(jobs.period_slot_ms) / 1000 AS consumed_total_slots FROM `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.ASSIGNMENTS` AS assignment INNER JOIN `ADMIN_PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.RESERVATIONS` AS reservation ON (assignment.reservation_name = reservation.reservation_name) INNER JOIN `PROJECT_ID.region-LOCATION.INFORMATION_SCHEMA.JOBS_TIMELINE` AS jobs ON ( UPPER(CONCAT('ADMIN_PROJECT_ID:LOCATION.', assignment.reservation_name)) = UPPER(jobs.reservation_id)) WHERE assignment.assignee_id = 'PROJECT_ID' AND assignment.job_type = 'CONTINUOUS' AND jobs.period_start BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 1 DAY) AND CURRENT_TIMESTAMP() GROUP BY 1, 2, 3 ORDER BY jobs.period_start DESC;
Substitua:
ADMIN_PROJECT_ID
: o ID do projeto de administração que contém a reserva.LOCATION
: o local da reserva.PROJECT_ID
: o ID do projeto atribuído à reserva. Somente informações sobre consultas contínuas em execução neste projeto são retornadas.
Também é possível monitorar reservas de consulta contínua usando outras ferramentas, como Metrics Explorer e gráficos de recursos administrativos. Para mais informações, consulte Monitore as reservas do BigQuery.
Usar o gráfico de execução de consultas
Você pode usar o gráfico de execução de consulta para receber insights de desempenho e estatísticas gerais para uma consulta contínua. Para mais informações, consulte Visualizar insights de desempenho da consulta.
Visualizar o histórico de tarefas
Você pode conferir os detalhes do job de consulta contínua no seu histórico profissional pessoal ou no histórico de job do projeto. Para mais informações, consulte Ver detalhes do job.
A lista histórica de jobs é classificada pela hora de início do job. Isso significa que as consultas contínuas que estão em execução há um tempo pode não estar perto do início da lista.
Usar a análise de jobs administrativos
No explorador de jobs administrativos, filtre seus jobs para mostrar consultas contínuas definindo o filtro Categoria do job como Consulta contínua.
Usar o Cloud Monitoring
É possível conferir métricas específicas das consultas contínuas do BigQuery usando o Cloud Monitoring. Para mais informações, consulte Criar painéis, gráficos e alertas e leia sobre as métricas disponíveis para visualização.
Alerta sobre consultas com falha
Em vez de verificar rotineiramente se as consultas contínuas falharam, é útil criar um alerta para notificar você sobre a falha. Uma maneira de fazer isso é criar uma métrica com base em registros do Cloud Logging personalizada com um filtro para seus jobs e uma política de alertas do Cloud Monitoring com base nessa métrica:
- Ao criar uma consulta contínua, use um prefixo de ID de job personalizado.
Várias consultas contínuas podem compartilhar o mesmo prefixo.
Por exemplo, você pode usar o prefixo
prod-
para indicar uma consulta de produção. No Google Cloud console, acesse a página Métricas com base em registros.
Clique em Criar métrica. O painel Criar métrica de registros é exibido.
Em Tipo de métrica, selecione Contador.
Na seção Detalhes, atribua um nome à métrica. Por exemplo,
CUSTOM_JOB_ID_PREFIX-metric
.Na seção Seleção de filtros, insira o seguinte no editor Criar filtro:
resource.type = "bigquery_project" protoPayload.resourceName : "projects/PROJECT_ID/jobs/CUSTOM_JOB_ID_PREFIX" severity = ERROR
Substitua:
PROJECT_ID
: o nome do projeto.CUSTOM_JOB_ID_PREFIX
: o nome do prefixo de ID do job personalizado que você definiu para sua consulta contínua.
Clique em Criar métrica.
No menu de navegação, clique em Métricas com base em registros. A métrica que você acabou de criar aparece na lista de métricas definidas pelo usuário.
Na linha da métrica, clique em
Mais ações e em Criar alerta com base na métrica.Clique em Próxima. Não é necessário mudar as configurações padrão na página Modo de configuração da política.
Clique em Próxima. Não é necessário mudar as configurações padrão na página Configurar acionador de alertas.
Selecione os canais de notificação e insira um nome para a política de alertas.
Clique em Criar política.
Para testar seu alerta, execute uma consulta contínua com o prefixo de ID do job personalizado selecionado e cancele-o. Pode levar alguns minutos para que o alerta chegue ao seu canal de notificação.
Tentar novamente consultas com falha
Tentar novamente uma consulta contínua com falha pode ajudar a evitar situações em que um pipeline contínuo fica inativo por um longo período ou exige intervenção humana para ser reiniciado. Ao tentar de novo uma consulta contínua com falha, considere o seguinte:
- Se é aceitável reprocessar uma quantidade de dados processados pela consulta anterior antes da falha.
- Como lidar com a limitação de novas tentativas ou usar a espera exponencial.
Uma abordagem possível para automatizar a repetição de consultas é a seguinte:
Crie um coletor do Cloud Logging com base em um filtro de inclusão que corresponda aos seguintes critérios para encaminhar registros a um tópico do Pub/Sub:
resource.type = "bigquery_project" protoPayload.resourceName : "projects/PROJECT_ID/jobs/CUSTOM_JOB_ID_PREFIX" severity = ERROR
Substitua:
PROJECT_ID
: o nome do projeto.CUSTOM_JOB_ID_PREFIX
: o nome do prefixo de ID do job personalizado que você definiu para sua consulta contínua.
Crie uma função do Cloud Run que seja acionada em resposta ao Pub/Sub que recebe registros correspondentes ao seu filtro.
A função do Cloud Run pode aceitar a carga útil de dados da mensagem do Pub/Sub e tentar iniciar uma nova consulta contínua usando a mesma sintaxe SQL da consulta com falha, mas no início, logo após a interrupção do job anterior.
Por exemplo, é possível usar uma função semelhante a esta:
Python
Antes de testar esta amostra, siga as instruções de configuração do Python no Guia de início rápido do BigQuery: como usar bibliotecas de cliente. Para mais informações, consulte a documentação de referência da API BigQuery em Python.
Para autenticar no BigQuery, configure o Application Default Credentials. Para mais informações, acesse Configurar a autenticação para bibliotecas de cliente.
A seguir
- Saiba como criar e executar consultas contínuas.