En este documento, se proporcionan instrucciones para migrar en un solo paso de la versión preliminar del glosario empresarial, que admitía metadatos de Data Catalog, a la versión disponible de forma general del glosario empresarial, que admite metadatos de Dataplex Universal Catalog.
Antes de comenzar
Instala gcloud o paquetes de Python. Autentica tu cuenta de usuario y las credenciales predeterminadas de la aplicación (ADC) que usan las bibliotecas de Python. Ejecuta los siguientes comandos y sigue las instrucciones basadas en el navegador:
gcloud init gcloud auth login gcloud auth application-default loginHabilita las siguientes APIs:
Crea uno o varios buckets de Cloud Storage en cualquiera de tus proyectos. Los buckets se usarán como ubicación temporal para los archivos de importación. Cuantos más buckets proporciones, más rápido será el proceso de importación. Otorga el rol de IAM de administrador de almacenamiento a la cuenta de servicio que ejecuta la migración:
service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com
Reemplaza
MIGRATION_PROJECT_IDpor el proyecto desde el que migrarás los glosarios.Configura el repositorio:
Clona el repositorio:
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-importInstale los paquetes necesarios:
pip3 install -r requirements.txt cd migration
Roles obligatorios
Ejecuta la secuencia de comandos de migración
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2
Reemplaza lo siguiente:
USER_PROJECT_ID: Es el ID del proyecto que se migrará.BUCKET1yBUCKET2: Son los IDs de bucket de Cloud Storage que se usarán para la importación.
Glosarios de alcance en la migración
Para migrar solo glosarios específicos, define su alcance proporcionando sus URLs respectivas.
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"
Reemplaza GLOSSARY_URL1 (y GLOSSARY_URL2) por las URLs de los glosarios que migrarás.
Reanuda la migración para los errores de trabajos de importación
La presencia de archivos después de la migración indica que fallaron algunos trabajos de importación. Para reanudar la migración, ejecuta el siguiente comando:
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import