Transição para o glossário empresarial no Dataplex Universal Catalog

Este documento fornece instruções para migrar num único passo da versão de pré-visualização do glossário empresarial, que suportava metadados do Data Catalog, para a versão geralmente disponível do glossário empresarial, que suporta metadados do catálogo universal do Dataplex.

Antes de começar

  1. Instale gcloud ou pacotes Python. Autentique a sua conta de utilizador e as credenciais padrão da aplicação (ADC) que as bibliotecas Python usam. Execute os seguintes comandos e siga as instruções baseadas no navegador:

    gcloud init
    gcloud auth login
    gcloud auth application-default login
    
  2. Ative as seguintes APIs:

  3. Crie um ou vários contentores do Cloud Storage em qualquer um dos seus projetos. Os contentores vão ser usados como uma localização temporária para os ficheiros de importação. Quanto mais contentores fornecer, mais rápida é a importação. Conceda a função de administrador de armazenamento do IAM à conta de serviço que executa a migração:

    service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com

    Substitua MIGRATION_PROJECT_ID pelo projeto do qual está a migrar os glossários.

  4. Configure o repositório:

    1. Clone o repositório:

      git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
      cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import
      
    2. Instale os pacotes necessários:

      pip3 install -r requirements.txt
      cd migration
      

Funções necessárias

Execute o script de migração

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2

Substitua o seguinte:

  • USER_PROJECT_ID: o ID do projeto a ser migrado.
  • BUCKET1 e BUCKET2: os IDs dos contentores de armazenamento na nuvem a usar para a importação.

Glossários de âmbito na migração

Para migrar apenas glossários específicos, defina o respetivo âmbito fornecendo os URLs correspondentes.

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"

Substitua GLOSSARY_URL1 (e GLOSSARY_URL2) pelos URLs dos glossários que está a migrar.

Retome a migração para falhas de tarefas de importação

A presença de ficheiros após a migração indica que algumas tarefas de importação falharam. Para retomar a migração, execute o seguinte comando:

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import