Transisi ke glosarium bisnis di Katalog Universal Dataplex

Dokumen ini memberikan petunjuk untuk melakukan migrasi dalam satu langkah dari glosarium bisnis versi pratinjau, yang mendukung metadata Data Catalog, ke glosarium bisnis versi yang tersedia secara umum, yang mendukung metadata Dataplex Universal Catalog.

Sebelum memulai

  1. Instal gcloud atau paket python. Autentikasi akun pengguna Anda dan Kredensial Default Aplikasi (ADC) yang digunakan library Python. Jalankan perintah berikut dan ikuti perintah berbasis browser:

    gcloud init
    gcloud auth login
    gcloud auth application-default login
    
  2. Mengaktifkan API berikut:

  3. Buat satu atau beberapa bucket Cloud Storage di salah satu project Anda. Bucket akan digunakan sebagai lokasi sementara untuk file impor. Makin banyak bucket yang Anda berikan, makin cepat impornya. Berikan peran IAM Admin Storage ke akun layanan yang menjalankan migrasi:

    service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com

    Ganti MIGRATION_PROJECT_ID dengan project tempat Anda memigrasikan glosarium.

  4. Siapkan repositori:

    1. Meng-cloning repository

      git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
      cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import
      
    2. Instal paket yang diperlukan:

      pip3 install -r requirements.txt
      cd migration
      

Peran yang diperlukan

Jalankan skrip migrasi

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2

Ganti kode berikut:

  • USER_PROJECT_ID: project ID project yang akan dimigrasikan.
  • BUCKET1 dan BUCKET2: ID bucket Cloud Storage yang akan digunakan untuk impor.

Cakupan glosarium dalam migrasi

Untuk memigrasikan hanya glosarium tertentu, tentukan cakupannya dengan memberikan URL masing-masing.

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"

Ganti GLOSSARY_URL1 (dan GLOSSARY_URL2) dengan URL glosarium yang Anda migrasikan.

Melanjutkan migrasi untuk kegagalan tugas impor

Keberadaan file setelah migrasi menunjukkan bahwa beberapa tugas impor telah gagal. Untuk melanjutkan migrasi, jalankan perintah berikut:

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import