Ajouter des métadonnées à une table BigQuery
Découvrez comment gérer les métadonnées dans Dataplex Universal Catalog.
Ce guide de démarrage rapide vous explique comment ajouter des métadonnées à une table BigQuery. Dans ce guide de démarrage rapide, vous allez :
Créer un ensemble de données et une table BigQuery à partir d'un ensemble de données public
Créez un modèle qui définit un ensemble de champs de métadonnées associés.
Ce modèle est appelé type d'aspect. L'ensemble des champs de métadonnées associés qui décrivent les métadonnées techniques et métier de vos composants de données est appelé aspect.
Ajoutez des métadonnées à la table.
Dans Dataplex Universal Catalog, chaque élément de données est représenté par une entrée. Pour associer des métadonnées à un élément de données, vous devez ajouter des aspects à l'entrée.
Avant de commencer
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Accéder à IAM - Sélectionnez le projet.
- Cliquez sur Accorder l'accès.
-
Dans le champ Nouveaux comptes principaux, saisissez votre identifiant utilisateur. Il s'agit généralement de l'adresse e-mail d'un compte Google.
- Dans la liste Sélectionner un rôle, sélectionnez un rôle.
- Pour attribuer des rôles supplémentaires, cliquez sur Ajouter un autre rôle et ajoutez tous les rôles supplémentaires.
- Cliquez sur Enregistrer.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Dataplex and BigQuery APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin), which contains theserviceusage.services.enablepermission. Learn how to grant roles. -
Make sure that you have the following role or roles on the project: Dataplex Catalog Admin, BigQuery Data Owner, BigQuery Job User
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
Accéder à IAM - Sélectionnez le projet.
- Cliquez sur Accorder l'accès.
-
Dans le champ Nouveaux comptes principaux, saisissez votre identifiant utilisateur. Il s'agit généralement de l'adresse e-mail d'un compte Google.
- Dans la liste Sélectionner un rôle, sélectionnez un rôle.
- Pour attribuer des rôles supplémentaires, cliquez sur Ajouter un autre rôle et ajoutez tous les rôles supplémentaires.
- Cliquez sur Enregistrer.
-
Dans la console Google Cloud , accédez à la page BigQuery Studio.
Créez un ensemble de données :
Dans le volet Explorateur, recherchez votre projet. Cliquez sur Afficher les actions, puis sur Créer un ensemble de données.
Dans le champ ID de l'ensemble de données, saisissez
catalog_demo_dataset.Conservez les valeurs par défaut des autres champs.
Cliquez sur Créer un ensemble de données.
Copiez une table publique dans votre ensemble de données :
Dans le volet Explorateur, recherchez la table nommée
bigquery-public-data.new_york_citibike.citibike_stations. Vous devrez peut-être définir le champ d'application de la recherche pour inclure le projetbigquery-public-data.Ce tableau fait partie de l'ensemble de données NYC Citi Bike Trips, un ensemble de données public qui contient des données sur un programme de vélos en libre-service.
Sélectionnez la table
citibike_stations.Cliquez sur Copier. Saisissez les informations suivantes :
- Projet : sélectionnez votre projet.
- Ensemble de données : sélectionnez
catalog_demo_dataset. - Table : saisissez
bike_stations.
Cliquez sur Copier.
Dans le volet Explorateur, localisez l'ensemble de données
catalog_demo_datasetet vérifiez que la tablebike_stationsfigure dans l'ensemble de données.Dans la console Google Cloud , accédez à la page Catalogue de Dataplex Universal Catalog.
Cliquez sur l'onglet Types d'aspects et modèles de tags, puis sur l'onglet Personnalisé.
Cliquez sur Créer un type d'aspect.
Dans le champ ID du type d'aspect, saisissez
data-governance-demo.Dans le champ Emplacement, sélectionnez
global.Dans la section Modèle, cliquez sur Ajouter un champ. Utilisez les informations du tableau suivant pour ajouter plusieurs champs au type d'aspect :
Nom Type Obligatoire Description source-of-data-assetTexte Non - retention-dateDate et heure Non - data-classificationEnum
Ajoutez les valeurs
Public,SensitiveetConfidential.Oui - has-piiBooléen Oui Whether the data asset has personally identifiable informationCliquez sur Enregistrer.
Dans la console Google Cloud , accédez à la page Rechercher de Dataplex Universal Catalog.
Dans le champ de recherche, saisissez
catalog_demo_dataset.Sélectionnez la table bike_stations.
Ajoutez un aspect personnalisé à l'entrée :
Dans la section Tags et aspects, à côté de Tags et aspects facultatifs, cliquez sur Ajouter.
Sélectionnez le type d'aspect
data-governance-demo.Cela crée un aspect qui utilise votre type d'aspect comme modèle.
Saisissez les valeurs suivantes :
- Source de l'élément de données :
Copied from NYC Citi Bike Trips public dataset - Date de conservation : saisissez une date.
- Classification des données :
Public - Comporte des informations personnelles :
False
- Source de l'élément de données :
Cliquez sur Enregistrer.
Pour afficher les valeurs de métadonnées que vous avez ajoutées, dans la section Tags et aspects, sélectionnez l'aspect data-governance-demo.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Supprimez l'ensemble de données :
Dans la console Google Cloud , accédez à la page BigQuery Studio.
Dans le volet Explorateur, recherchez l'ensemble de données
catalog_demo_dataset.Cliquez sur Afficher les actions, puis sur Supprimer. Confirmez l'opération lorsque vous y êtes invité.
Supprimez le type d'aspect :
Dans la console Google Cloud , accédez à la page Catalogue de Dataplex Universal Catalog.
Cliquez sur l'onglet Types d'aspects et modèles de tags, puis sur l'onglet Personnalisé.
Cliquez sur le type d'aspect
data-governance-demo.Cliquez sur Supprimer. Confirmez l'opération lorsque vous y êtes invité.
- En savoir plus sur la gestion des métadonnées
- Découvrez comment rechercher des ressources.
- Découvrez comment utiliser les aspects et les types d'aspects.
Créer un ensemble de données et une table
Définir un modèle de métadonnées : créer un type d'aspect
Ajouter des métadonnées à la table : ajouter un aspect à l'entrée
Effectuer un nettoyage
Pour éviter que les ressources utilisées dans cette démonstration soient facturées sur votre compte Google Cloud , procédez comme suit :
Supprimer le projet
Le moyen le plus simple d'arrêter la facturation est de supprimer le projet que vous avez créé pour ce guide de démarrage rapide.
Supprimer des ressources individuelles
Si vous souhaitez réutiliser votre projet, supprimez les ressources que vous avez créées.