Adicionar metadados a uma tabela do BigQuery
Saiba como usar o gerenciamento de metadados no Dataplex Universal Catalog.
Este guia de início rápido mostra como adicionar metadados a uma tabela do BigQuery. Neste guia de início rápido, você vai fazer o seguinte:
Crie um conjunto de dados e uma tabela do BigQuery com base em um conjunto de dados público.
Crie um modelo que defina um conjunto de campos de metadados relacionados.
O modelo é chamado de tipo de aspecto. O conjunto de campos de metadados relacionados, que descrevem os metadados comerciais e técnicos dos seus recursos de dados, é chamado de aspecto.
Adicione metadados à tabela.
No Dataplex Universal Catalog, cada recurso de dados é representado como uma entrada. Para anexar metadados a um recurso de dados, adicione aspectos à entrada.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Acessar o IAM - Selecione o projeto.
- Clique em Conceder acesso.
-
No campo Novos principais, digite seu identificador de usuário. Normalmente, é o endereço de e-mail de uma Conta do Google.
- Na lista Selecionar papel, escolha um.
- Para conceder outros papéis, adicione-os clicando em Adicionar outro papel.
- Clique em Salvar.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Acessar o IAM - Selecione o projeto.
- Clique em Conceder acesso.
-
No campo Novos principais, digite seu identificador de usuário. Normalmente, é o endereço de e-mail de uma Conta do Google.
- Na lista Selecionar papel, escolha um.
- Para conceder outros papéis, adicione-os clicando em Adicionar outro papel.
- Clique em Salvar.
-
No console do Google Cloud , acesse a página BigQuery Studio.
Crie um conjunto de dados:
No painel Explorador, encontre seu projeto. Clique em
Acessar ações e depois em Criar conjunto de dados.No campo ID do conjunto de dados, digite
catalog_demo_dataset
.Mantenha os valores padrão dos outros campos.
Clique em Criar conjunto de dados.
Copie uma tabela pública para seu conjunto de dados:
No painel Explorador, pesquise a tabela chamada
bigquery-public-data.new_york_citibike.citibike_stations
. Talvez seja necessário definir o escopo da pesquisa para incluir o projetobigquery-public-data
.Essa tabela faz parte do conjunto de dados de passeios da Citi Bike de Nova York, um conjunto de dados público que contém informações sobre um programa de compartilhamento de bicicletas.
Selecione a tabela
citibike_stations
.Clique em Copiar. Digite as seguintes informações:
- Projeto: selecione seu projeto
- Conjunto de dados: selecione
catalog_demo_dataset
. - Tabela: insira
bike_stations
.
Clique em Copiar.
No painel Explorador, localize o conjunto de dados
catalog_demo_dataset
e confirme se a tabelabike_stations
está listada nele.No console do Google Cloud , acesse a página Catálogo do Dataplex Universal Catalog.
Clique na guia Tipos de aspectos e modelos de tag e, em seguida, na guia Personalizado.
Clique em Criar tipo de aspecto.
No campo ID do tipo de aspecto, insira
data-governance-demo
.Em Local, selecione
global
.Na seção Modelo, clique em Adicionar campo. Use as informações na tabela a seguir para adicionar vários campos ao tipo de aspecto:
Nome Tipo É obrigatório Descrição source-of-data-asset
Texto Não - retention-date
Data e hora Não - data-classification
Enum
Adicione os valores
Public
,Sensitive
eConfidential
.Sim - has-pii
Booleano Sim Whether the data asset has personally identifiable information
Clique em Salvar.
No console Google Cloud , acesse a página Pesquisa do Dataplex Universal Catalog.
Na caixa de pesquisa, digite
catalog_demo_dataset
.Selecione a tabela bike_stations.
Adicione um aspecto personalizado à entrada:
Na seção Tags e aspectos, ao lado de Tags e aspectos opcionais, clique em
Adicionar.Selecione o tipo de aspecto
data-governance-demo
.Isso cria um aspecto que usa seu tipo de aspecto como modelo.
Digite os seguintes valores:
- Fonte do recurso de dados:
Copied from NYC Citi Bike Trips public dataset
- Data de retenção: insira uma data.
- Classificação de dados:
Public
- Tem PII:
False
- Fonte do recurso de dados:
Clique em Salvar.
Para conferir os valores de metadados adicionados, na seção Tags e aspectos, selecione o aspecto data-governance-demo.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Exclua o conjunto de dados:
No console do Google Cloud , acesse a página BigQuery Studio.
No painel Explorador, pesquise o conjunto de dados
catalog_demo_dataset
.Clique em
Consultar ações e em Excluir. Confirme quando solicitado.
Exclua o tipo de aspecto:
No console Google Cloud , acesse a página Catálogo do Dataplex Universal Catalog.
Clique na guia Tipos de aspectos e modelos de tag e, em seguida, na guia Personalizado.
Clique no tipo de aspecto
data-governance-demo
.Clique em Excluir. Confirme quando solicitado.
- Saiba mais sobre o gerenciamento de metadados.
- Saiba como pesquisar recursos.
- Saiba como trabalhar com aspectos e tipos de aspectos.
Criar um conjunto de dados e uma tabela
Definir um modelo de metadados: criar um tipo de aspecto
Adicionar metadados à tabela: adicione um aspecto à entrada
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.
Excluir o projeto
A maneira mais fácil de evitar cobranças é excluir o projeto criado para este guia de início rápido.
Excluir recursos individuais
Se você quiser reutilizar o projeto, exclua os recursos criados.