Adicione metadados a uma tabela do BigQuery
Saiba como começar a usar a gestão de metadados no Dataplex Universal Catalog.
Este início rápido mostra como adicionar metadados a uma tabela do BigQuery. Neste início rápido, faz o seguinte:
Crie um conjunto de dados e uma tabela do BigQuery com base num conjunto de dados público.
Crie um modelo que defina um conjunto de campos de metadados relacionados.
O modelo denomina-se tipo de aspeto. O conjunto de campos de metadados relacionados, que descrevem os metadados empresariais e técnicos dos seus recursos de dados, é denominado aspeto.
Adicione metadados à tabela.
No Dataplex Universal Catalog, cada recurso de dados é representado como uma entrada. Para anexar metadados a um recurso de dados, adicione aspetos à entrada.
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Aceder ao IAM - Selecione o projeto.
- Clique em Conceder acesso.
-
No campo Novos responsáveis, introduza o identificador do utilizador. Normalmente, este é o endereço de email de uma Conta Google.
- Na lista Selecionar uma função, selecione uma função.
- Para conceder funções adicionais, clique em Adicionar outra função e adicione cada função adicional.
- Clique em Guardar.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Aceder ao IAM - Selecione o projeto.
- Clique em Conceder acesso.
-
No campo Novos responsáveis, introduza o identificador do utilizador. Normalmente, este é o endereço de email de uma Conta Google.
- Na lista Selecionar uma função, selecione uma função.
- Para conceder funções adicionais, clique em Adicionar outra função e adicione cada função adicional.
- Clique em Guardar.
-
Na Google Cloud consola, aceda à página BigQuery Studio.
Crie um conjunto de dados:
No painel Explorador, localize o seu projeto. Clique em
Ver ações, e, de seguida, clique em Criar conjunto de dados.No campo ID do conjunto de dados, introduza
catalog_demo_dataset
.Mantenha os valores predefinidos para os outros campos.
Clique em Criar conjunto de dados.
Copie uma tabela pública para o seu conjunto de dados:
No painel Explorador, pesquise a tabela com o nome
bigquery-public-data.new_york_citibike.citibike_stations
. Pode ter de definir o âmbito da pesquisa para incluir obigquery-public-data
projeto.Esta tabela faz parte do conjunto de dados NYC Citi Bike Trips, um conjunto de dados público que contém dados sobre um programa de partilha de bicicletas.
Selecione a tabela
citibike_stations
.Clique em Copiar. Introduza as seguintes informações:
- Projeto: selecione o seu projeto.
- Conjunto de dados: selecione
catalog_demo_dataset
. - Tabela: introduza
bike_stations
.
Clique em Copiar.
No painel Explorador, localize o conjunto de dados
catalog_demo_dataset
e confirme que a tabelabike_stations
está listada no conjunto de dados.Na Google Cloud consola, aceda à página Catálogo do Dataplex Universal Catalog.
Clique no separador Tipos de aspetos e modelos de etiquetas e, de seguida, no separador Personalizado.
Clique em Criar tipo de aspeto.
No campo ID do tipo de aspeto, introduza
data-governance-demo
.Para Localização, selecione
global
.Na secção Modelo, clique em Adicionar campo. Use as informações na tabela seguinte para adicionar vários campos ao tipo de aspeto:
Nome Tipo É obrigatório Descrição source-of-data-asset
Texto Não - retention-date
Data e hora Não - data-classification
Enum
Adicione os valores
Public
,Sensitive
eConfidential
.Sim - has-pii
Booleano Sim Whether the data asset has personally identifiable information
Clique em Guardar.
Na Google Cloud consola, aceda à página Pesquisa do Dataplex Universal Catalog.
Na caixa de pesquisa, introduza
catalog_demo_dataset
.Selecione a tabela bike_stations.
Adicione um aspeto personalizado à entrada:
Na secção Etiquetas e aspetos, junto a Etiquetas e aspetos opcionais, clique em
Adicionar.Selecione o
data-governance-demo
tipo de formato.Esta ação cria um aspeto que usa o seu tipo de aspeto como modelo.
Introduza os seguintes valores:
- Origem do recurso de dados:
Copied from NYC Citi Bike Trips public dataset
- Data de retenção: introduza uma data.
- Classificação de dados:
Public
- Tem PII:
False
- Origem do recurso de dados:
Clique em Guardar.
Para ver os valores de metadados que adicionou, na secção Etiquetas e aspetos, selecione o aspeto data-governance-demo.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Elimine o conjunto de dados:
Na Google Cloud consola, aceda à página BigQuery Studio.
No painel Explorador, pesquise o conjunto de dados
catalog_demo_dataset
.Clique em
Ver ações e, de seguida, em Eliminar. Confirme quando lhe for pedido.
Elimine o tipo de aspeto:
Na Google Cloud consola, aceda à página Catálogo do Dataplex Universal Catalog.
Clique no separador Tipos de aspetos e modelos de etiquetas e, de seguida, clique no separador Personalizado.
Clique no tipo de aspeto
data-governance-demo
.Clique em Eliminar. Confirme quando lhe for pedido.
- Saiba mais sobre a gestão de metadados.
- Saiba como pesquisar recursos.
- Saiba como trabalhar com aspetos e tipos de aspetos.
Crie um conjunto de dados e uma tabela
Defina um modelo de metadados: crie um tipo de aspeto
Adicione metadados à tabela: adicione um aspeto à entrada
Limpar
Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.
Elimine o projeto
A forma mais fácil de parar a faturação é eliminar o projeto que criou para este início rápido.
Elimine recursos individuais
Se quiser reutilizar o seu projeto, elimine os recursos que criou.