Agrega metadatos a una tabla de BigQuery

Aprende sobre la administración de metadatos en Dataplex Universal Catalog.

En esta guía de inicio rápido, se muestra cómo agregar metadatos a una tabla de BigQuery. En esta guía de inicio rápido, puedes hacer lo siguiente:

  1. Crea un conjunto de datos y una tabla de BigQuery basados en un conjunto de datos públicos.

  2. Crea una plantilla que defina un conjunto de campos de metadatos relacionados.

    La plantilla se denomina tipo de aspecto. El conjunto de campos de metadatos relacionados, que describen los metadatos técnicos y empresariales de tus recursos de datos, se denomina aspecto.

  3. Agrega metadatos a la tabla.

    En Dataplex Universal Catalog, cada recurso de datos se representa como una entrada. Para adjuntar metadatos a un recurso de datos, agrega aspectos a la entrada.

Antes de comenzar

  1. Accede a tu Google Cloud cuenta de. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  8. Verify that billing is enabled for your Google Cloud project.

  9. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

Roles obligatorios

Para obtener los permisos que necesitas para agregar metadatos a una tabla de BigQuery, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios a través de roles personalizados o cualquier otro rol predefinido.

Crea un conjunto de datos y una tabla

  1. En la consola de Google Cloud , ve a la página BigQuery Studio.

    Ir a BigQuery Studio

  2. Crea un conjunto de datos:

    1. En el panel de la izquierda, haz clic en Explorar.

      Botón destacado del panel Explorador.

      Si no ves el panel izquierdo, haz clic en Expandir panel izquierdo para abrirlo.

    2. En el panel Explorador, busca tu proyecto. Haz clic en Ver acciones y, luego, en Crear conjunto de datos.

    3. En el campo ID de conjunto de datos, ingresa catalog_demo_dataset.

      Mantén los valores predeterminados en los otros campos.

    4. Haz clic en Crear conjunto de datos.

  3. Copia una tabla pública en tu conjunto de datos:

    1. En el panel Explorador, busca la tabla llamada bigquery-public-data.new_york_citibike.citibike_stations. Es posible que debas configurar el alcance de la búsqueda para incluir el proyecto bigquery-public-data.

      Esta tabla forma parte del conjunto de datos de viajes de Citi Bike de la ciudad de Nueva York, un conjunto de datos públicos que contiene información sobre un programa de bicicletas compartidas.

    2. Selecciona la tabla citibike_stations.

    3. Haz clic en Copiar. Ingresa la siguiente información:

      • Proyecto: Selecciona tu proyecto.
      • Conjunto de datos: Selecciona catalog_demo_dataset.
      • Tabla: Ingresa bike_stations.
    4. Haz clic en Copiar.

  4. En el panel Explorador , busca el conjunto de datos catalog_demo_dataset y confirma que la tabla bike_stations aparezca en él.

Define una plantilla de metadatos: crea un tipo de aspecto

  1. En la Google Cloud consola de, ve a la página Catálogo de Dataplex Universal Catalog.

    Ir al catálogo

  2. Haz clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, luego, en la pestaña Personalizado.

  3. Haz clic en Crear tipo de aspecto.

  4. En el campo ID de tipo de aspecto, ingresa data-governance-demo.

  5. En Ubicación selecciona global.

  6. En la sección Plantilla, haz clic en Agregar campo. Usa la información de la siguiente tabla para agregar varios campos al tipo de aspecto:

    Nombre Tipo Es obligatorio Descripción
    source-of-data-asset Texto No -
    retention-date Fecha y hora No -
    data-classification

    Enum

    Agrega los valores Public, Sensitive, y Confidential.

    -
    has-pii Booleano Whether the data asset has personally identifiable information
  7. Haz clic en Guardar.

Agrega metadatos a la tabla: agrega un aspecto a la entrada

  1. En la Google Cloud consola de, ve a la página Búsqueda de Dataplex Universal Catalog.

    Ir a Búsqueda

  2. En el cuadro de búsqueda, ingresa catalog_demo_dataset.

  3. Selecciona la tabla bike_stations.

  4. Agrega un aspecto personalizado a la entrada:

    1. En la sección Aspectos y etiquetas, junto a Aspectos y etiquetas opcionales, haz clic en Agregar.

    2. Selecciona el tipo de aspecto data-governance-demo.

      Esto crea un aspecto que usa tu tipo de aspecto como plantilla.

    3. Ingresa los siguientes valores:

      • Fuente del recurso de datos: Copied from NYC Citi Bike Trips public dataset
      • Fecha de retención: Ingresa una fecha.
      • Clasificación de datos: Public
      • Tiene información de identificación personal (IIP): False
    4. Haz clic en Guardar.

  5. Para ver los valores de metadatos que agregaste, en la sección Etiquetas y aspectos, selecciona el aspecto data-governance-demo.

Limpia

Sigue estos pasos para evitar que se apliquen cargos a tu Google Cloud cuenta de por los recursos que usaste en esta página.

Borra el proyecto

La manera más fácil de detener la facturación es borrar el proyecto que creaste para esta guía de inicio rápido.

  1. En la Google Cloud consola, ve a la página Administrar recursos.

    Ir a Administrar recursos

  2. En la lista de proyectos, elige el proyecto que tú quieres borrar y haz clic en Borrar.
  3. En el diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Borra los recursos individuales

Si deseas volver a usar tu proyecto, borra los recursos que creaste.

  1. Borra el conjunto de datos:

    1. En la consola de Google Cloud , ve a la página BigQuery Studio.

      Ir a BigQuery Studio

    2. En el panel de la izquierda, haz clic en Explorar.

      Botón destacado del panel Explorador.

    3. En el panel Explorador, busca el conjunto de datos catalog_demo_dataset.

    4. Haz clic en Ver acciones y, luego, en Borrar. Confirma cuando se te solicite.

  2. Borra el tipo de aspecto:

    1. En la consola de Google Cloud , ve a la página Catálogo de Dataplex Universal Catalog.

      Ir al catálogo

    2. Haz clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, luego, en la pestaña Personalizado.

    3. Haz clic en el tipo de aspecto data-governance-demo.

    4. Haz clic en Borrar. Confirma cuando se te solicite.

¿Qué sigue?