Aggiungi metadati a una tabella BigQuery

Scopri come iniziare a utilizzare la gestione dei metadati in Dataplex Universal Catalog.

Questa guida rapida mostra come aggiungere metadati a una tabella BigQuery. In questa guida rapida, imparerai a:

  1. Crea un set di dati e una tabella BigQuery basati su un set di dati pubblico.

  2. Crea un template che definisca un insieme di campi di metadati correlati.

    Il template è chiamato tipo di aspetto. L'insieme di campi di metadati correlati, che descrivono i metadati aziendali e tecnici per gli asset di dati, è chiamato aspetto.

  3. Aggiungi metadati alla tabella.

    In Dataplex Universal Catalog, ogni asset di dati è rappresentato come una voce. Per collegare i metadati a un asset di dati, aggiungi aspetti alla voce.

Prima di iniziare

  1. Accedi al tuo Google Cloud account. Se non hai mai utilizzato Google Cloud, crea un account per valutare il rendimento dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti senza costi per l'esecuzione, il test e il deployment dei workload.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  4. Verify that billing is enabled for your Google Cloud project.

  5. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator role (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  7. If you're using an existing project for this guide, verify that you have the permissions required to complete this guide. If you created a new project, then you already have the required permissions.

  8. Verify that billing is enabled for your Google Cloud project.

  9. Enable the Dataplex and BigQuery APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per aggiungere metadati a una tabella BigQuery, chiedi all'amministratore di concederti i seguenti ruoli IAM sul progetto:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

Crea un set di dati e una tabella

  1. Nella console Google Cloud , vai alla pagina BigQuery Studio.

    Vai a BigQuery Studio

  2. Crea un set di dati:

    1. Nel riquadro a sinistra, fai clic su Spazio di esplorazione:

      Pulsante evidenziato per il riquadro Spazio di esplorazione.

      Se non vedi il riquadro a sinistra, fai clic su Espandi riquadro a sinistra per aprirlo.

    2. Nel riquadro Explorer, individua il progetto. Fai clic su Visualizza azioni, quindi su Crea set di dati.

    3. Nel campo Dataset ID (ID set di dati), inserisci catalog_demo_dataset.

      Mantieni i valori predefiniti per gli altri campi.

    4. Fai clic su Crea set di dati.

  3. Copia una tabella pubblica nel tuo set di dati:

    1. Nel riquadro Spazio di esplorazione, cerca la tabella denominata bigquery-public-data.new_york_citibike.citibike_stations. Potresti dover impostare l'ambito di ricerca in modo da includere il progetto bigquery-public-data.

      Questa tabella fa parte del set di dati NYC Citi Bike Trips, un set di dati pubblico che contiene dati su un programma di bike sharing.

    2. Seleziona la tabella citibike_stations.

    3. Fai clic su Copia. Inserisci le seguenti informazioni:

      • Progetto: seleziona il tuo progetto.
      • Set di dati: seleziona catalog_demo_dataset.
      • Tabella: inserisci bike_stations.
    4. Fai clic su Copia.

  4. Nel riquadro Spazio di esplorazione , individua il set di dati catalog_demo_dataset e verifica che la tabella bike_stations sia elencata nel set di dati.

Definisci un template di metadati: crea un tipo di aspetto

  1. Nella Google Cloud console, vai alla pagina Dataplex Universal Catalog Catalog (catalogo).

    Vai al Catalog (catalogo)

  2. Fai clic sulla scheda Tipi di aspetto e modelli di tag, quindi sulla scheda Personalizzato.

  3. Fai clic su Crea tipo di aspetto.

  4. Nel campo ID tipo di aspetto, inserisci data-governance-demo.

  5. Per Località, seleziona global.

  6. Nella sezione Modello, fai clic su Aggiungi campo. Utilizza le informazioni nella tabella seguente per aggiungere diversi campi al tipo di aspetto:

    Nome Tipo Obbligatorio Descrizione
    source-of-data-asset Testo No -
    retention-date Data e ora No -
    data-classification

    Enum

    Aggiungi i valori Public, Sensitive, e Confidential.

    -
    has-pii Booleano Whether the data asset has personally identifiable information
  7. Fai clic su Salva.

Aggiungi metadati alla tabella: aggiungi un aspetto alla voce

  1. Nella Google Cloud console, vai alla pagina Dataplex Universal Catalog Search (cerca).

    Vai a Cerca

  2. Nella casella di ricerca, inserisci catalog_demo_dataset.

  3. Seleziona la tabella bike_stations.

  4. Aggiungi un aspetto personalizzato alla voce:

    1. Nella sezione Tag e aspetti, accanto a Tag e aspetti facoltativi, fai clic su Aggiungi.

    2. Seleziona il tipo di aspetto data-governance-demo.

      In questo modo viene creato un aspetto che utilizza il tipo di aspetto come template.

    3. Inserisci i seguenti valori:

      • Origine dell'asset di dati: Copied from NYC Citi Bike Trips public dataset
      • Data di conservazione: inserisci una data.
      • Classificazione dati: Public
      • Con PII: False
    4. Fai clic su Salva.

  5. Per visualizzare i valori dei metadati che hai aggiunto, seleziona l'aspetto data-governance-demo nella sezione Tag e aspetti.

Libera spazio

Per evitare che al tuo Google Cloud account vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

Elimina il progetto

Il modo più semplice per interrompere la fatturazione è eliminare il progetto che hai creato per questa guida rapida.

  1. Nella Google Cloud console, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  2. Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  3. Nella finestra di dialogo, digita l'ID progetto e fai clic su Chiudi per eliminare il progetto.

Elimina singole risorse

Se vuoi riutilizzare il progetto, elimina le risorse che hai creato.

  1. Elimina il set di dati:

    1. Nella console Google Cloud , vai alla pagina BigQuery Studio.

      Vai a BigQuery Studio

    2. Nel riquadro a sinistra, fai clic su Spazio di esplorazione:

      Pulsante evidenziato per il riquadro Spazio di esplorazione.

    3. Nel riquadro Spazio di esplorazione, cerca il set di dati catalog_demo_dataset.

    4. Fai clic su Visualizza azioni, quindi su Elimina. Conferma quando ti viene richiesto.

  2. Elimina il tipo di aspetto:

    1. Nella console Google Cloud , vai alla pagina Dataplex Universal Catalog.

      Vai al Catalog (catalogo)

    2. Fai clic sulla scheda Tipi di aspetto e modelli di tag, quindi sulla scheda Personalizzato.

    3. Fai clic sul tipo di aspetto data-governance-demo.

    4. Fai clic su Elimina. Conferma quando ti viene richiesto.

Passaggi successivi