Criar fluxos de trabalho de integração de dados usando a página "Pipelines e conexões"
A página Pipelines e conexões do BigQuery no console simplifica suas tarefas de integração de dados ao fornecer fluxos de trabalho de configuração guiados e específicos do BigQuery para serviços como o serviço de transferência de dados do BigQuery, o Datastream e o Pub/Sub.
Use a página Pipelines e conexões para realizar as seguintes tarefas:
- Carregar dados. Encontre e carregue dados de fontes compatíveis usando uma experiência guiada.
- Agendamento de tarefas de dados. Programe seus processos de dados para serem executados automaticamente, incluindo consultas, notebooks, preparações de dados e pipelines programados.
- Transformação de dados. Crie pipelines e preparações de dados que realizam operações como limpeza, estruturação e preparação de dados para análise e geração de relatórios.
- Criar conexões com fontes de dados. Conecte-se a fontes de dados externas, ambientes de execução de computação e serviços de IA para acesso aos dados e execução remota.
Depois de criar as tarefas, a página Pipelines e conexões oferece um local único para gerenciar e monitorar seus recursos. É possível conferir o status dos seus recursos na visualização em lista e usar as páginas de monitoramento detalhado para ver métricas operacionais de cada recurso configurado, como consultas programadas, pipelines, transferências, conexões, streams e assinaturas.
As métricas operacionais incluem históricos de execução do serviço de transferência de dados do BigQuery, capacidade de processamento e latência para assinaturas do Pub/Sub, além de atualização de dados e contagens de eventos para pipelines do Datastream.
As páginas de monitoramento também incluem informações de solução de problemas, como registros de execuções do serviço de transferência de dados do BigQuery e status de objetos do Datastream.
Ativar ou desativar
Durante a prévia, é possível ativar ou desativar o uso da página Pipelines e conexões.
Ativar
Para ativar o uso da página Pipelines e conexões, siga estas etapas:
Acesse o console do Google Cloud .
Na barra de ferramentas do console Google Cloud , clique em Menu de navegação.
Clique em Soluções > Todos os produtos.
Na seção Analytics, clique em BigQuery.
A página do Studio do BigQuery é aberta.
Para expandir o menu de navegação, clique em Alternar menu de navegação do BigQuery.
No menu de navegação, clique em uma das seguintes opções:
- Transferências de dados
- Consultas programadas
- Agendamento
Acesse o banner de pipelines e conexões unificados.
Clique em Ativar.
Depois que você ativar a opção, as páginas Transferências de dados, Programação e Consultas programadas serão substituídas pela página Pipelines e conexões.
Desativar
Para desativar o uso da página unificada Pipelines e conexões, siga estas etapas:
Na página Pipelines e conexões, clique em Desativar no banner unificado de pipelines e conexões.
Uma caixa de diálogo de feedback será aberta. Envie feedback sobre o motivo da desativação, como falta de recursos ou bugs.
Clique em Enviar e depois em Fechar.
Depois de enviar o formulário, o menu de navegação volta a usar as páginas separadas Transferências de dados, Programação e Consultas programadas.
Criar um recurso de integração de dados
Para criar recursos como consultas programadas, transferências de dados e conexões externas, faça o seguinte:
Acesse a página Pipelines e conexões.
Clique em Criar.
No recurso que você quer criar, clique na opção no card:
Para adicionar dados de uma das fontes compatíveis usando um fluxo de trabalho guiado, clique em Adicionar dados no card Carregar dados.
Para agendar uma consulta, um notebook, uma preparação de dados ou um pipeline, no card Agendar tarefas de dados, clique em Agendar e escolha a opção adequada.
Para criar um pipeline de transformação ou preparação de dados, no card Transformar dados, clique em Criar e escolha a opção adequada.
Para criar uma conexão com uma fonte de dados externa, no card Conexões externas, clique em Criar conexão.
Monitore seus recursos
Depois de criar os recursos, é possível visualizá-los e monitorá-los.
Acesse a página Pipelines e conexões.
Para ver detalhes sobre suas conexões, clique na guia Conexões.
Para monitorar seus pipelines, clique na guia Pipelines. Use essa página para conferir detalhes como status, tipo e histórico de execução do pipeline.
Para conferir os detalhes de um pipeline, clique no link na coluna Nome de exibição.
A seguir
- Saiba como criar um pipeline do Dataform no BigQuery.
- Saiba como programar um pipeline.
- Saiba como programar uma consulta.
- Saiba mais sobre as transferências do serviço de transferência de dados do BigQuery.