Añadir metadatos a una tabla de BigQuery

Consulta cómo empezar a gestionar los metadatos en Dataplex Universal Catalog.

En esta guía de inicio rápido se muestra cómo añadir metadatos a una tabla de BigQuery. En esta guía de inicio rápido, harás lo siguiente:

  1. Crea un conjunto de datos y una tabla de BigQuery a partir de un conjunto de datos público.

  2. Crea una plantilla que defina un conjunto de campos de metadatos relacionados.

    La plantilla se denomina tipo de aspecto. El conjunto de campos de metadatos relacionados, que describen los metadatos técnicos y empresariales de tus recursos de datos, se denomina aspecto.

  3. Añade metadatos a la tabla.

    En Dataplex Universal Catalog, cada recurso de datos se representa como una entrada. Para adjuntar metadatos a un recurso de datos, añade aspectos a la entrada.

Antes de empezar

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  5. Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Conceder acceso.
    4. En el campo Nuevos principales, introduce tu identificador de usuario. Normalmente, se trata de la dirección de correo de una cuenta de Google.

    5. En la lista Selecciona un rol, elige un rol.
    6. Para conceder más roles, haz clic en Añadir otro rol y añade cada rol adicional.
    7. Haz clic en Guardar.
  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. Verify that billing is enabled for your Google Cloud project.

  8. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  9. Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Ir a IAM
    2. Selecciona el proyecto.
    3. Haz clic en Conceder acceso.
    4. En el campo Nuevos principales, introduce tu identificador de usuario. Normalmente, se trata de la dirección de correo de una cuenta de Google.

    5. En la lista Selecciona un rol, elige un rol.
    6. Para conceder más roles, haz clic en Añadir otro rol y añade cada rol adicional.
    7. Haz clic en Guardar.
  10. Crear un conjunto de datos y una tabla

    1. En la Google Cloud consola, ve a la página BigQuery Studio.

      Ir a BigQuery Studio

    2. Crea un conjunto de datos:

      1. En el panel Explorador, busca tu proyecto. Haz clic en Ver acciones y, a continuación, en Crear conjunto de datos.

      2. En el campo ID del conjunto de datos, introduce catalog_demo_dataset.

        Mantenga los valores predeterminados de los demás campos.

      3. Haz clic en Crear conjunto de datos.

    3. Para copiar una tabla pública en tu conjunto de datos, sigue estos pasos:

      1. En el panel Explorador, busca la tabla llamada bigquery-public-data.new_york_citibike.citibike_stations. Es posible que tengas que definir el ámbito de búsqueda para incluir el bigquery-public-data proyecto.

        Esta tabla forma parte del conjunto de datos NYC Citi Bike Trips, un conjunto de datos público que contiene información sobre un programa de bicicletas compartidas.

      2. Selecciona la tabla citibike_stations.

      3. Haz clic en Copiar. Introduce la siguiente información:

        • Proyecto: selecciona tu proyecto.
        • Conjunto de datos: selecciona catalog_demo_dataset.
        • Tabla: introduce bike_stations.
      4. Haz clic en Copiar.

    4. En el panel Explorador, busca el conjunto de datos catalog_demo_dataset y comprueba que la tabla bike_stations figure en él.

    Definir una plantilla de metadatos: crear un tipo de aspecto

    1. En la Google Cloud consola, ve a la página Catálogo de Dataplex Universal Catalog.

      Ir al catálogo

    2. Haga clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, a continuación, en la pestaña Personalizado.

    3. Haz clic en Crear tipo de aspecto.

    4. En el campo ID de tipo de aspecto, introduce data-governance-demo.

    5. En Ubicación, selecciona global.

    6. En la sección Plantilla, haz clic en Añadir campo. Utilice la información de la siguiente tabla para añadir varios campos al tipo de aspecto:

      Nombre Tipo Obligatorio Descripción
      source-of-data-asset Texto No -
      retention-date Fecha y hora No -
      data-classification

      Enum

      Añade los valores Public, Sensitive y Confidential.

      -
      has-pii Booleano Whether the data asset has personally identifiable information
    7. Haz clic en Guardar.

    Añadir metadatos a la tabla: añadir un aspecto a la entrada

    1. En la Google Cloud consola, ve a la página Búsqueda de Dataplex Universal Catalog.

      Ir a la búsqueda

    2. En el cuadro de búsqueda, escriba catalog_demo_dataset.

    3. Selecciona la tabla bike_stations.

    4. Añade un aspecto personalizado a la entrada:

      1. En la sección Etiquetas y aspectos, junto a Etiquetas y aspectos opcionales, haz clic en Añadir.

      2. Selecciona el tipo de aspecto data-governance-demo.

        De esta forma, se crea un aspecto que usa tu tipo de aspecto como plantilla.

      3. Introduce los siguientes valores:

        • Fuente del recurso de datos: Copied from NYC Citi Bike Trips public dataset
        • Fecha de conservación: introduce una fecha.
        • Clasificación de datos: Public
        • Tiene IIP: False
      4. Haz clic en Guardar.

    5. Para ver los valores de metadatos que has añadido, en la sección Etiquetas y aspectos, selecciona el aspecto data-governance-demo.

    Limpieza

    Para evitar que se apliquen cargos en tu cuenta de Google Cloud por los recursos utilizados en esta página, sigue estos pasos.

    Eliminar el proyecto

    La forma más sencilla de detener la facturación es eliminar el proyecto que has creado para esta guía de inicio rápido.

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    Eliminar recursos concretos

    Si quieres reutilizar el proyecto, elimina los recursos que hayas creado.

    1. Elimina el conjunto de datos:

      1. En la Google Cloud consola, ve a la página BigQuery Studio.

        Ir a BigQuery Studio

      2. En el panel Explorador, busca el conjunto de datos catalog_demo_dataset.

      3. Haz clic en Ver acciones y, a continuación, en Eliminar. Confirma la acción cuando se te solicite.

    2. Elimina el tipo de aspecto:

      1. En la Google Cloud consola, ve a la página Catálogo de Dataplex Universal Catalog.

        Ir al catálogo

      2. Haz clic en la pestaña Tipos de aspecto y plantillas de etiquetas y, a continuación, en la pestaña Personalizado.

      3. Haga clic en el tipo de aspecto data-governance-demo.

      4. Haz clic en Eliminar. Confirma la acción cuando se te solicite.

    Siguientes pasos