Añadir metadatos a una tabla de BigQuery
Consulta cómo empezar a gestionar los metadatos en Dataplex Universal Catalog.
En esta guía de inicio rápido se muestra cómo añadir metadatos a una tabla de BigQuery. En esta guía de inicio rápido, harás lo siguiente:
Crea un conjunto de datos y una tabla de BigQuery a partir de un conjunto de datos público.
Crea una plantilla que defina un conjunto de campos de metadatos relacionados.
La plantilla se denomina tipo de aspecto. El conjunto de campos de metadatos relacionados, que describen los metadatos técnicos y empresariales de tus recursos de datos, se denomina aspecto.
Añade metadatos a la tabla.
En Dataplex Universal Catalog, cada recurso de datos se representa como una entrada. Para adjuntar metadatos a un recurso de datos, añade aspectos a la entrada.
Antes de empezar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Ir a IAM - Selecciona el proyecto.
- Haz clic en Conceder acceso.
-
En el campo Nuevos principales, introduce tu identificador de usuario. Normalmente, se trata de la dirección de correo de una cuenta de Google.
- En la lista Selecciona un rol, elige un rol.
- Para conceder más roles, haz clic en Añadir otro rol y añade cada rol adicional.
- Haz clic en Guardar.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Ir a IAM - Selecciona el proyecto.
- Haz clic en Conceder acceso.
-
En el campo Nuevos principales, introduce tu identificador de usuario. Normalmente, se trata de la dirección de correo de una cuenta de Google.
- En la lista Selecciona un rol, elige un rol.
- Para conceder más roles, haz clic en Añadir otro rol y añade cada rol adicional.
- Haz clic en Guardar.
-
En la Google Cloud consola, ve a la página BigQuery Studio.
Crea un conjunto de datos:
En el panel Explorador, busca tu proyecto. Haz clic en
Ver acciones y, a continuación, en Crear conjunto de datos.En el campo ID del conjunto de datos, introduce
catalog_demo_dataset
.Mantenga los valores predeterminados de los demás campos.
Haz clic en Crear conjunto de datos.
Para copiar una tabla pública en tu conjunto de datos, sigue estos pasos:
En el panel Explorador, busca la tabla llamada
bigquery-public-data.new_york_citibike.citibike_stations
. Es posible que tengas que definir el ámbito de búsqueda para incluir elbigquery-public-data
proyecto.Esta tabla forma parte del conjunto de datos NYC Citi Bike Trips, un conjunto de datos público que contiene información sobre un programa de bicicletas compartidas.
Selecciona la tabla
citibike_stations
.Haz clic en Copiar. Introduce la siguiente información:
- Proyecto: selecciona tu proyecto.
- Conjunto de datos: selecciona
catalog_demo_dataset
. - Tabla: introduce
bike_stations
.
Haz clic en Copiar.
En el panel Explorador, busca el conjunto de datos
catalog_demo_dataset
y comprueba que la tablabike_stations
figure en él.En la Google Cloud consola, ve a la página Catálogo de Dataplex Universal Catalog.
Haga clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, a continuación, en la pestaña Personalizado.
Haz clic en Crear tipo de aspecto.
En el campo ID de tipo de aspecto, introduce
data-governance-demo
.En Ubicación, selecciona
global
.En la sección Plantilla, haz clic en Añadir campo. Utilice la información de la siguiente tabla para añadir varios campos al tipo de aspecto:
Nombre Tipo Obligatorio Descripción source-of-data-asset
Texto No - retention-date
Fecha y hora No - data-classification
Enum
Añade los valores
Public
,Sensitive
yConfidential
.Sí - has-pii
Booleano Sí Whether the data asset has personally identifiable information
Haz clic en Guardar.
En la Google Cloud consola, ve a la página Búsqueda de Dataplex Universal Catalog.
En el cuadro de búsqueda, escriba
catalog_demo_dataset
.Selecciona la tabla bike_stations.
Añade un aspecto personalizado a la entrada:
En la sección Etiquetas y aspectos, junto a Etiquetas y aspectos opcionales, haz clic en
Añadir.Selecciona el tipo de aspecto
data-governance-demo
.De esta forma, se crea un aspecto que usa tu tipo de aspecto como plantilla.
Introduce los siguientes valores:
- Fuente del recurso de datos:
Copied from NYC Citi Bike Trips public dataset
- Fecha de conservación: introduce una fecha.
- Clasificación de datos:
Public
- Tiene IIP:
False
- Fuente del recurso de datos:
Haz clic en Guardar.
Para ver los valores de metadatos que has añadido, en la sección Etiquetas y aspectos, selecciona el aspecto data-governance-demo.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Elimina el conjunto de datos:
En la Google Cloud consola, ve a la página BigQuery Studio.
En el panel Explorador, busca el conjunto de datos
catalog_demo_dataset
.Haz clic en
Ver acciones y, a continuación, en Eliminar. Confirma la acción cuando se te solicite.
Elimina el tipo de aspecto:
En la Google Cloud consola, ve a la página Catálogo de Dataplex Universal Catalog.
Haz clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, a continuación, en la pestaña Personalizado.
Haga clic en el tipo de aspecto
data-governance-demo
.Haz clic en Eliminar. Confirma la acción cuando se te solicite.
- Consulta más información sobre la gestión de metadatos.
- Consulta cómo buscar recursos.
- Consulta cómo trabajar con aspectos y tipos de aspectos.
Crear un conjunto de datos y una tabla
Definir una plantilla de metadatos: crear un tipo de aspecto
Añadir metadatos a la tabla: añadir un aspecto a la entrada
Limpieza
Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.
Eliminar el proyecto
La forma más sencilla de detener la facturación es eliminar el proyecto que has creado para esta guía de inicio rápido.
Eliminar recursos concretos
Si quieres reutilizar el proyecto, elimina los recursos que hayas creado.