在 Dataplex Universal Catalog 中轉換至商務詞彙表

本文提供操作說明,協助您將支援 Data Catalog 中繼資料的商務詞彙表搶先版,單一步驟遷移至支援 Dataplex Universal Catalog 中繼資料的商務詞彙表正式版。

事前準備

  1. 安裝 gcloudPython 套件。驗證使用者帳戶和 Python 程式庫使用的應用程式預設憑證 (ADC)。執行下列指令,並按照瀏覽器中的提示操作:

    gcloud init
    gcloud auth login
    gcloud auth application-default login
    
  2. 啟用下列 API:

  3. 在任一專案中建立一或多個 Cloud Storage 值區。這些 bucket 會做為匯入檔案的暫存位置。提供的 bucket 越多,匯入速度就越快。將 Storage 管理員身分與存取權管理角色授予執行遷移作業的服務帳戶:

    service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com

    MIGRATION_PROJECT_ID 替換為要遷移字彙表的專案。

  4. 設定存放區:

    1. 複製存放區:

      git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
      cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import
      
    2. 安裝必要套件:

      pip3 install -r requirements.txt
      cd migration
      

必要的角色

執行遷移指令碼

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2

更改下列內容:

  • USER_PROJECT_ID:要遷移的專案 ID。
  • BUCKET1BUCKET2:要用於匯入作業的 Cloud Storage 值區 ID。

遷移範圍詞彙表

如要只遷移特定字彙表,請提供相應網址來定義範圍。

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"

GLOSSARY_URL1 (和 GLOSSARY_URL2) 替換為要遷移的字彙表網址。

繼續執行匯入工作失敗的遷移作業

如果遷移後仍有檔案,表示部分匯入工作失敗。如要繼續遷移作業,請執行下列指令:

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import