En este documento se proporcionan instrucciones para migrar en un solo paso de la versión preliminar del glosario de empresa, que admitía metadatos de Data Catalog, a la versión disponible de forma general del glosario de empresa, que admite metadatos de Dataplex Universal Catalog.
Antes de empezar
Instala gcloud o paquetes de Python. Autentica tu cuenta de usuario y las credenciales predeterminadas de la aplicación (ADC) que usan las bibliotecas de Python. Ejecuta los siguientes comandos y sigue las indicaciones del navegador:
gcloud init gcloud auth login gcloud auth application-default loginHabilita las siguientes APIs:
Crea uno o varios segmentos de Cloud Storage en cualquiera de tus proyectos. Los contenedores se usarán como ubicación temporal para los archivos de importación. Cuantos más segmentos proporcione, más rápido será el proceso de importación. Conceda el rol de administrador de Storage de IAM a la cuenta de servicio que ejecute la migración:
service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com
Sustituye
MIGRATION_PROJECT_IDpor el proyecto del que vas a migrar los glosarios.Configura el repositorio:
Clona el repositorio:
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-importInstala los paquetes necesarios:
pip3 install -r requirements.txt cd migration
Roles obligatorios
Ejecutar la secuencia de comandos de migración
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2
Haz los cambios siguientes:
USER_PROJECT_ID: el ID del proyecto que se va a migrar.BUCKET1yBUCKET2: los IDs de los segmentos de Cloud Storage que se van a usar para la importación.
Glosarios de ámbito en la migración
Para migrar solo glosarios específicos, defina su ámbito proporcionando sus URLs correspondientes.
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"
Sustituye GLOSSARY_URL1 (y GLOSSARY_URL2) por las URLs de los glosarios que vas a migrar.
Reanudar la migración en caso de errores en las tareas de importación
La presencia de archivos después de la migración indica que algunas tareas de importación han fallado. Para reanudar la migración, ejecuta el siguiente comando:
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import