Realiza la transición al glosario empresarial en Dataplex Universal Catalog

En este documento, se proporcionan instrucciones para migrar en un solo paso de la versión preliminar del glosario empresarial, que admitía metadatos de Data Catalog, a la versión disponible de forma general del glosario empresarial, que admite metadatos de Dataplex Universal Catalog.

Antes de comenzar

  1. Instala gcloud o paquetes de Python. Autentica tu cuenta de usuario y las credenciales predeterminadas de la aplicación (ADC) que usan las bibliotecas de Python. Ejecuta los siguientes comandos y sigue las instrucciones basadas en el navegador:

    gcloud init
    gcloud auth login
    gcloud auth application-default login
    
  2. Habilita las siguientes APIs:

  3. Crea uno o varios buckets de Cloud Storage en cualquiera de tus proyectos. Los buckets se usarán como ubicación temporal para los archivos de importación. Cuantos más buckets proporciones, más rápido será el proceso de importación. Otorga el rol de IAM de administrador de almacenamiento a la cuenta de servicio que ejecuta la migración:

    service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com

    Reemplaza MIGRATION_PROJECT_ID por el proyecto desde el que migrarás los glosarios.

  4. Configura el repositorio:

    1. Clona el repositorio:

      git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
      cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import
      
    2. Instale los paquetes necesarios:

      pip3 install -r requirements.txt
      cd migration
      

Roles obligatorios

Ejecuta la secuencia de comandos de migración

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2

Reemplaza lo siguiente:

  • USER_PROJECT_ID: Es el ID del proyecto que se migrará.
  • BUCKET1 y BUCKET2: Son los IDs de bucket de Cloud Storage que se usarán para la importación.

Glosarios de alcance en la migración

Para migrar solo glosarios específicos, define su alcance proporcionando sus URLs respectivas.

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"

Reemplaza GLOSSARY_URL1 (y GLOSSARY_URL2) por las URLs de los glosarios que migrarás.

Reanuda la migración para los errores de trabajos de importación

La presencia de archivos después de la migración indica que fallaron algunos trabajos de importación. Para reanudar la migración, ejecuta el siguiente comando:

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import