In diesem Dokument finden Sie eine Anleitung für die einstufige Migration von der Preview-Version des Geschäftsglossars, die Data Catalog-Metadaten unterstützt, zur allgemein verfügbaren Version des Geschäftsglossars, die Dataplex Universal Catalog-Metadaten unterstützt.
Hinweise
Installieren Sie gcloud oder Python-Pakete. Authentifizieren Sie Ihr Nutzerkonto und die Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC), die von den Python-Bibliotheken verwendet werden. Führen Sie die folgenden Befehle aus und folgen Sie den browserbasierten Aufforderungen:
gcloud init gcloud auth login gcloud auth application-default loginAktivieren Sie folgende APIs:
Erstellen Sie einen oder mehrere Cloud Storage-Buckets in einem Ihrer Projekte. Die Buckets werden als temporärer Speicherort für die Importdateien verwendet. Je mehr Buckets Sie angeben, desto schneller erfolgt der Import. Weisen Sie dem Dienstkonto, mit dem die Migration ausgeführt wird, die IAM-Rolle „Storage-Administrator“ zu:
service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com
Ersetzen Sie
MIGRATION_PROJECT_IDdurch das Projekt, aus dem Sie die Glossare migrieren.Repository einrichten:
Klonen Sie das Repository:
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-importInstallieren Sie die erforderlichen Pakete:
pip3 install -r requirements.txt cd migration
Erforderliche Rollen
Migrationsskript ausführen
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2
Ersetzen Sie Folgendes:
USER_PROJECT_ID: die Projekt-ID des Projekts, das migriert werden soll.BUCKET1undBUCKET2: Die Cloud Storage-Bucket-IDs, die für den Import verwendet werden sollen.
Glossare im Migrationsbereich
Wenn Sie nur bestimmte Glossare migrieren möchten, definieren Sie ihren Umfang, indem Sie die entsprechenden URLs angeben.
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"
Ersetzen Sie GLOSSARY_URL1 (und GLOSSARY_URL2) durch die URLs der Glossare, die Sie migrieren.
Migration bei Fehlern im Importjob fortsetzen
Das Vorhandensein von Dateien nach der Migration weist darauf hin, dass einige Importjobs fehlgeschlagen sind. Führen Sie den folgenden Befehl aus, um die Migration fortzusetzen:
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import