Programar execuções de produção
Neste guia de início rápido, mostramos as etapas para programar execuções de produção no Dataform:
- Crie um repositório do Dataform.
- Conceda os papéis necessários.
Crie uma configuração de versão e uma configuração de fluxo de trabalho.
Crie uma configuração de versão
productione defina a frequência de criação de resultados de compilaçãoproduction. Em seguida, crie uma configuração de fluxo de trabalhoproduction, selecione a configuração de lançamentoproductione defina uma programação para executar os resultados da compilaçãoproduction.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator role
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the BigQuery and Dataform APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
Administrador do Dataform (
roles/dataform.admin) em repositórios -
Editor do Dataform (
roles/dataform.editor) em espaços de trabalho e invocações de fluxos de trabalho -
Usuário da conta de serviço (
roles/iam.serviceAccountUser) na conta de serviço personalizada -
Administrador do IAM do projeto (
roles/resourcemanager.projectIamAdmin) no projeto - Editor de dados do BigQuery
(
roles/bigquery.dataEditor) em projetos em que o Dataform precisa de acesso de leitura e gravação, o que geralmente inclui o projeto que hospeda seu repositório do Dataform. - Leitor de dados do BigQuery
(
roles/bigquery.dataViewer) em projetos que precisam de acesso somente leitura do Dataform. - Usuário de jobs do BigQuery
(
roles/bigquery.jobUser) no projeto que hospeda seu repositório do Dataform. - Criador do token da conta de serviço
(
roles/iam.serviceAccountTokenCreator) - Usuário da conta de serviço
(
roles/iam.serviceAccountUser) No console do Google Cloud , acesse a página IAM.
Clique em Conceder acesso.
No campo Novos principais, insira o ID da sua conta de serviço personalizada.
No menu Selecionar um papel, selecione os seguintes papéis um por um, usando Adicionar outro papel para cada papel adicional:
- Editor de dados do BigQuery
- Visualizador de dados do BigQuery
- Usuário de jobs do BigQuery
Clique em Salvar.
No console Google Cloud , acesse a página Contas de serviço.
Selecione sua conta de serviço personalizada.
Acesse Principais com acesso e clique em Conceder acesso.
No campo Novos principais, insira o ID do agente de serviço padrão do Dataform.
O ID do agente de serviço padrão do Dataform está no seguinte formato:
service-PROJECT_NUMBER@gcp-sa-dataform.iam.gserviceaccount.comNa lista Selecionar um papel, adicione os seguintes papéis:
- Usuário da conta de serviço
- Criador do token da conta de serviço
Clique em Salvar.
No Google Cloud console, acesse a página Dataform.
Clique em Criar repositório.
Na página Criar repositório, faça o seguinte:
No campo Código do repositório, insira
quickstart-production.Na lista Região, selecione
europe-west4.No campo Conta de serviço, clique em Inserir manualmente e digite o nome da sua conta de serviço personalizada. Insira sua conta de serviço personalizada nesse campo.
Clique em Criar.
Clique em Acessar repositórios.
No Google Cloud console, acesse a página Dataform.
Clique em
quickstart-production.Clique em Versões e programação e em Criar versão de produção.
No painel Criar configuração de versão, defina as seguintes configurações:
- No campo ID da versão, digite
production. - No campo Commitish do Git, deixe o valor padrão
main. - Na seção Frequência de programação, no menu Repetições, selecione Personalizada.
- No campo Programação personalizada, insira
0 16 * * *. No menu Fuso horário, selecione um fuso horário UTC+1, por exemplo, Horário padrão da Europa Central (CET).
Todos os dias às 16h UTC+1, o Dataform compila o repositório
quickstart-productione aplica as configurações de compilação configuradas nessa configuração de lançamento para criar resultados de compilaçãoproduction.
- No campo ID da versão, digite
Clique em Criar.
A configuração de lançamento
productioncria um resultado de compilação de todo o repositórioquickstart-productiontodos os dias às 16h UTC+1.Verifique se você está na guia Lançamentos e programação. Acesse a seção Configurações do fluxo de trabalho e clique em Criar.
No painel Criar configuração do fluxo de trabalho, defina as seguintes configurações:
- No campo ID da configuração, insira
production. - No menu Configuração da versão, selecione
production. - Na seção Frequência de programação, no menu Repetições, selecione Personalizada.
- No campo Programação personalizada, insira
0 17 * * *. No menu Fuso horário, selecione um fuso horário UTC+1, por exemplo, Horário padrão da Europa Central (CET).
Todos os dias às 17h UTC+1, o Dataform executa o resultado da compilação
productionmais recente do repositórioquickstart-production.Clique em Todas as ações.
O Dataform executa todas as ações do fluxo de trabalho no resultado da compilação
production.
- No campo ID da configuração, insira
Clique em Criar.
A configuração do fluxo de trabalho
productionexecuta todo o resultado da compilação mais recente criado pela configuração da versão de produção todos os dias às 17h UTC+1.No Google Cloud console, acesse a página Dataform.
Selecione o repositório
quickstart-production.Clique em Lançamentos e programação.
Na seção Configurações da versão, clique em
production.No Google Cloud console, acesse a página Dataform.
Selecione o repositório
quickstart-production.Clique em Registros de execução de fluxo de trabalho.
Selecione uma execução de fluxo de trabalho para ver informações mais detalhadas, incluindo o status de cada ação e todos os registros.
No console do Google Cloud , acesse a página BigQuery.
No painel Explorer, expanda o projeto e selecione
dataform_production.Clique no menu Ações e selecione Excluir.
Na caixa de diálogo Excluir conjunto de dados, insira excluir e clique em Excluir.
No Google Cloud console, acesse a página Dataform.
Clique em
quickstart-production.Clique em Versões e programação e acesse a seção Configurações de lançamento.
Na configuração da versão
production, clique no menu Mais e em Excluir.Na caixa de diálogo Excluir configuração da versão, clique em Excluir.
No Google Cloud console, acesse a página Dataform.
Clique em
quickstart-production.Clique em Versões e programação e acesse a seção Configurações do fluxo de trabalho.
Na configuração do fluxo de trabalho
production, clique no menu Mais e em Excluir.Na caixa de diálogo Excluir configuração da versão, clique em Excluir.
No Google Cloud console, acesse a página Dataform.
Em
quickstart-production, clique no menu Mais e selecione Excluir.Na janela Excluir repositório, insira o nome do repositório para confirmar a exclusão.
Para confirmar, clique em Excluir.
- Para saber mais sobre contas de serviço, consulte Sobre contas de serviço personalizadas e agentes de serviço do Dataform.
- Para saber mais sobre o ciclo de vida do código no Dataform, consulte Introdução ao ciclo de vida do código no Dataform.
- Para saber mais sobre as práticas recomendadas para o ciclo de vida do fluxo de trabalho no Dataform, consulte Práticas recomendadas para o ciclo de vida do fluxo de trabalho.
- Para saber mais sobre as configurações de lançamento no Dataform, consulte Criar uma configuração de lançamento.
- Para saber mais sobre as configurações de fluxo de trabalho no Dataform, consulte Programar execuções com configurações de fluxo de trabalho.
Além disso, selecione ou crie uma conta de serviço personalizada para executar fluxos de trabalho no BigQuery.
Funções exigidas
Para receber as permissões necessárias para realizar todas as tarefas deste tutorial, peça ao administrador para conceder a você os seguintes papéis do IAM:
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias usando papéis personalizados ou outros papéis predefinidos.
Conceder os papéis necessários
Para executar fluxos de trabalho no BigQuery, use uma conta de serviço personalizada ou sua Conta do Google (prévia). No entanto, as credenciais de conta de serviço personalizada são a opção padrão para execuções programadas. Não é recomendável usar credenciais de conta de usuário da Conta do Google para execuções programadas.
Para executar fluxos de trabalho no BigQuery, sua conta de serviço personalizada precisa ter os seguintes papéis obrigatórios:
Para permitir que o Dataform use sua conta de serviço personalizada, o agente de serviço padrão do Dataform precisa ter os seguintes papéis no recurso da conta de serviço personalizada:
Para conceder esses papéis, siga estas etapas:
Criar um repositório do Dataform
Criar uma configuração de versão e uma configuração de fluxo de trabalho
Para criar resultados de compilação de produção do repositório quickstart-production e programar uma execução de tabelas production, siga estas etapas:
Conferir resultados anteriores de compilação do production
Para conferir os resultados de compilação de production programados anteriores, siga estas etapas:
Conferir execuções anteriores do fluxo de trabalho production
Para conferir as execuções anteriores do fluxo de trabalho production, siga estas etapas:
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.
Excluir o conjunto de dados criado no BigQuery
Para evitar cobranças por recursos do BigQuery, siga estas etapas para excluir o conjunto de dados chamado dataform_production:
Excluir a configuração da versão do Dataform
Não há custos associados à criação de configurações de lançamento do Dataform. No entanto, se você quiser excluir a configuração de lançamento production, siga estas etapas:
Excluir a configuração do fluxo de trabalho do Dataform
Para evitar cobranças pelos recursos do BigQuery, siga estas
etapas para excluir a configuração do fluxo de trabalho production do Dataform:
Excluir o repositório do Dataform
Não há custos associados à criação de repositórios do Dataform. No entanto, se você quiser excluir um repositório e todo o conteúdo dele, siga estas etapas: