Dataplex Universal Catalog의 비즈니스 용어집으로 전환

이 문서에서는 Data Catalog 메타데이터를 지원하는 비즈니스 용어집 프리뷰 버전에서 Dataplex Universal Catalog 메타데이터를 지원하는 비즈니스 용어집 정식 버전으로 한 번에 마이그레이션하는 방법을 설명합니다.

시작하기 전에

  1. gcloud 또는 Python 패키지를 설치합니다. 사용자 계정과 Python 라이브러리에서 사용하는 애플리케이션 기본 사용자 인증 정보(ADC)를 인증합니다. 다음 명령어를 실행하고 브라우저 기반 프롬프트를 따릅니다.

    gcloud init
    gcloud auth login
    gcloud auth application-default login
    
  2. 다음 API를 사용 설정합니다.

  3. 프로젝트에 하나 이상의 Cloud Storage 버킷을 만듭니다. 버킷은 가져오기 파일의 임시 위치로 사용됩니다. 버킷을 많이 제공할수록 가져오기가 빨라집니다. 마이그레이션을 실행하는 서비스 계정에 스토리지 관리자 IAM 역할을 부여합니다.

    service-MIGRATION_PROJECT_ID@gcp-sa-dataplex.iam.gserviceaccount.com

    MIGRATION_PROJECT_ID를 용어집을 이전할 프로젝트로 바꿉니다.

  4. 저장소를 설정합니다.

    1. 저장소를 복제합니다.

      git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
      cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import
      
    2. 필요한 패키지를 설치합니다.

      pip3 install -r requirements.txt
      cd migration
      

필요한 역할

마이그레이션 스크립트 실행

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2

다음을 바꿉니다.

  • USER_PROJECT_ID: 이전할 프로젝트의 프로젝트 ID
  • BUCKET1BUCKET2: 가져오기에 사용될 Cloud Storage 버킷 ID

마이그레이션의 범위 용어집

특정 용어집만 이전하려면 각 URL을 제공하여 범위를 정의하세요.

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --glossaries="GLOSSARY_URL1","GLOSSARY_URL2"

GLOSSARY_URL1(및 GLOSSARY_URL2)을 이전할 용어집의 URL로 바꿉니다.

가져오기 작업 실패 시 마이그레이션 재개

마이그레이션 후 파일이 있으면 일부 가져오기 작업이 실패한 것입니다. 마이그레이션을 재개하려면 다음 명령어를 실행합니다.

python3 run.py --project=MIGRATION_PROJECT_ID --user-project=USER_PROJECT_ID --buckets=BUCKET1,BUCKET2 --resume-import