Questo documento fornisce istruzioni per la migrazione in un unico passaggio dalla versione di anteprima del glossario aziendale, che supportava i metadati di Data Catalog, alla versione disponibile a livello generale del glossario aziendale, che supporta i metadati di Dataplex Universal Catalog.
Prima di iniziare
Installa gcloud o i pacchetti Python. Autentica il tuo account utente e le Credenziali predefinite dell'applicazione (ADC) utilizzate dalle librerie Python. Esegui questi comandi e segui le istruzioni basate sul browser:
gcloud init gcloud auth login gcloud auth application-default loginAbilita le seguenti API:
Crea uno o più bucket Cloud Storage in uno qualsiasi dei tuoi progetti. I bucket verranno utilizzati come posizione temporanea per i file di importazione. Più bucket fornisci, più veloce è l'importazione. Concedi il ruolo IAM Amministratore Storage all'account di servizio che esegue la migrazione:
service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com
Sostituisci
MIGRATION_PROJECT_IDcon il progetto da cui stai eseguendo la migrazione dei glossari.Configura il repository:
Clona il repository:
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-importInstalla i pacchetti richiesti:
pip3 install -r requirements.txt cd migration
Ruoli obbligatori
Esegui lo script di migrazione
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2
Sostituisci quanto segue:
USER_PROJECT_ID: l'ID progetto del progetto da migrare.BUCKET1eBUCKET2: gli ID bucket Cloud Storage da utilizzare per l'importazione.
Glossari nell'ambito della migrazione
Per eseguire la migrazione solo di glossari specifici, definisci il loro ambito fornendo i rispettivi URL.
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"
Sostituisci GLOSSARY_URL1 (e GLOSSARY_URL2)
con gli URL dei glossari che stai migrando.
Riprendere la migrazione per gli errori del job di importazione
La presenza di file dopo la migrazione indica che alcuni job di importazione non sono riusciti. Per riprendere la migrazione, esegui questo comando:
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import