Configurar outras ações

Esta página mostra como fazer o seguinte:

Antes de começar

  1. Noconsole, acesse a página Dataform. Google Cloud

    Acesse Dataform

  2. Selecione ou crie um repositório.

  3. Selecione ou crie um espaço de trabalho de desenvolvimento.

  4. Crie uma tabela.

  5. Defina um arquivo SQLX de um dos seguintes tipos:

Funções exigidas

Para receber as permissões necessárias para concluir as tarefas neste documento, peça ao administrador para conceder a você o papel do IAM Editor do Dataform (roles/dataform.editor) em espaços de trabalho. Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.

Também é possível conseguir as permissões necessárias usando personalizados papéis ou outros predefinidos papéis.

Definir uma instrução SQL a ser executada antes da criação da tabela

É possível configurar o Dataform para executar uma ou mais instruções SQL antes de criar uma tabela selecionada no BigQuery. Para executar uma instrução SQL antes que o Dataform crie uma tabela selecionada, adicione a instrução ao bloco pre_operations no arquivo SQLX de definição de tabela.

Para criar uma instrução SQL personalizada que é executada antes que o Dataform crie uma tabela específica, siga estas etapas:

  1. Acesse o espaço de trabalho de desenvolvimento.
  2. No painel Arquivos, expanda definitions/.
  3. Abra um arquivo de definição de tabela SQLX.
  4. Fora do bloco config, insira pre_operations { ... }.
  5. Em pre_operations { ... }, adicione sua instrução SQL.
  6. Opcional: para adicionar várias instruções, separe-as com ---.
  7. Opcional: clique em Formatar.

O exemplo de código a seguir mostra uma instrução pre_operations que cria uma função temporária que pode ser usada na instrução select:

pre_operations {
  CREATE TEMP FUNCTION AddFourAndDivide(x INT64, y INT64)
    RETURNS FLOAT64
    AS ((x + 4) / y);
}

Definir uma instrução SQL a ser executada após a criação da tabela

É possível configurar o Dataform para executar uma ou mais instruções SQL depois de criar uma tabela selecionada no BigQuery. Para executar uma instrução SQL depois que o Dataform cria uma tabela selecionada, adicione a instrução ao bloco post_operations no arquivo SQLX de definição de tabela. É possível adicionar várias instruções SQL ao bloco post_operations.

Para criar uma instrução SQL personalizada que é executada depois que o Dataform cria uma tabela específica, siga estas etapas:

  1. Acesse o espaço de trabalho de desenvolvimento.
  2. No painel Arquivos, expanda definitions/.
  3. Abra um arquivo de definição de tabela SQLX.
  4. Fora do bloco config, insira post_operations { ... }.
  5. Em post_operations { ... }, adicione sua instrução SQL.
  6. Opcional: clique em Formatar.

O exemplo de código a seguir mostra instruções post_operations que concedem acesso de grupos à tabela criada:

  post_operations {
    GRANT `roles/bigquery.dataViewer`
    ON
    TABLE ${self()}
    TO "group:allusers@example.com", "user:otheruser@example.com"
  }

Desativar a criação de tabelas

Para impedir que o Dataform crie uma tabela selecionada no BigQuery, desative a tabela no arquivo SQLX de definição de tabela. O Dataform mantém uma tabela desativada no gráfico de dependência, mas não a compila nem a cria. Isso pode ser útil, por exemplo, se uma tabela falhar e você não quiser que todo o fluxo de trabalho falhe enquanto corrige o problema.

Para desativar uma tabela, siga estas etapas:

  1. Acesse o espaço de trabalho de desenvolvimento.
  2. No painel Arquivos, expanda definitions/.
  3. Selecione um arquivo SQLX de definição de tabela.
  4. No bloco config do arquivo, insira disabled: true.
  5. Opcional: clique em Formatar.

O exemplo de código a seguir mostra uma tabela desativada:

config {
  type: "table",
  disabled: true
}

select * from ${ref("source_data")}

Adicionar tags de execução

Esta seção mostra como adicionar tags aos arquivos SQLX principais do Dataform para categorizar o fluxo de trabalho.

Para organizar os componentes do fluxo de trabalho em coleções, adicione tags personalizadas a arquivos SQLX dos seguintes tipos:

  • table
  • view
  • incremental
  • assertion
  • operations

Durante uma execução de fluxo de trabalho, é possível executar apenas arquivos com uma tag selecionada.

Com o Serviço Gerenciado para Apache Airflow ou Workflows junto com o Cloud Scheduler, é possível criar uma programação que executa um fluxo de trabalho do Dataform com uma tag selecionada em um intervalo específico.

Adicionar uma tag

É possível adicionar várias tags a um arquivo SQLX.

Para adicionar uma tag a um arquivo SQLX, siga estas etapas:

  1. Acesse o espaço de trabalho de desenvolvimento.
  2. No painel Arquivos, expanda definitions/.
  3. Selecione um arquivo SQLX.
  4. No bloco config, adicione uma tag no seguinte formato:

    tags: ["CUSTOM_TAG"]
    

    Substitua CUSTOM_TAG pela sua tag.

  5. Opcional: para adicionar várias tags, separe-as com uma vírgula (,).

  6. Opcional: clique em Formatar.

O exemplo de código a seguir mostra a visualização user_counts com as tags daily e hourly:

config {
  type: "view",
  name: "user_counts",
  tags: ["daily", "hourly"]
}

A seguir