本文提供操作說明,協助您將支援 Data Catalog 中繼資料的商務詞彙表搶先版,單一步驟遷移至支援 Dataplex Universal Catalog 中繼資料的商務詞彙表正式版。
事前準備
安裝 gcloud 或 Python 套件。驗證使用者帳戶和 Python 程式庫使用的應用程式預設憑證 (ADC)。執行下列指令,並按照瀏覽器中的提示操作:
gcloud init gcloud auth login gcloud auth application-default login啟用下列 API:
在任一專案中建立一或多個 Cloud Storage 值區。這些 bucket 會做為匯入檔案的暫存位置。提供的 bucket 越多,匯入速度就越快。將 Storage 管理員身分與存取權管理角色授予執行遷移作業的服務帳戶:
service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com
將
MIGRATION_PROJECT_ID替換為要遷移字彙表的專案。設定存放區:
複製存放區:
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import安裝必要套件:
pip3 install -r requirements.txt cd migration
必要的角色
執行遷移指令碼
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2
更改下列內容:
USER_PROJECT_ID:要遷移的專案 ID。BUCKET1和BUCKET2:要用於匯入作業的 Cloud Storage 值區 ID。
遷移範圍詞彙表
如要只遷移特定字彙表,請提供相應網址來定義範圍。
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"
將 GLOSSARY_URL1 (和 GLOSSARY_URL2) 替換為要遷移的字彙表網址。
繼續執行匯入工作失敗的遷移作業
如果遷移後仍有檔案,表示部分匯入工作失敗。如要繼續遷移作業,請執行下列指令:
python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import