Ce document explique comment migrer en une seule étape de la version Preview du glossaire d'entreprise, qui était compatible avec les métadonnées Data Catalog, vers la version en disponibilité générale du glossaire d'entreprise, qui est compatible avec les métadonnées Dataplex Universal Catalog.
Avant de commencer
Installez gcloud ou les packages Python. Authentifiez votre compte utilisateur et les identifiants par défaut de l'application (ADC) utilisés par les bibliothèques Python. Exécutez les commandes suivantes et suivez les invites du navigateur :
gcloud init gcloud auth login gcloud auth application-default loginActivez les API suivantes :
Créez un ou plusieurs buckets Cloud Storage dans l'un de vos projets. Les buckets serviront d'emplacement temporaire pour les fichiers d'importation. Plus vous fournissez de buckets, plus l'importation est rapide. Attribuez le rôle IAM d'administrateur de l'espace de stockage au compte de service qui exécute la migration :
service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com
Remplacez
MIGRATION_PROJECT_IDpar le projet à partir duquel vous migrez les glossaires.Configurez le dépôt :
Clonez le dépôt :
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-importInstallez les packages requis :
pip3 install -r requirements.txt cd migration
Rôles requis
Exécuter le script de migration
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2
Remplacez les éléments suivants :
USER_PROJECT_ID: ID du projet à migrer.BUCKET1etBUCKET2: ID des buckets Cloud Storage à utiliser pour l'importation.
Glossaires des champs d'application de la migration
Pour migrer uniquement des glossaires spécifiques, définissez leur portée en fournissant leurs URL respectives.
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"
Remplacez GLOSSARY_URL1 (et GLOSSARY_URL2) par les URL des glossaires que vous migrez.
Reprendre la migration en cas d'échec des tâches d'importation
La présence de fichiers après la migration indique que certaines tâches d'importation ont échoué. Pour reprendre la migration, exécutez la commande suivante :
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import