Google 시트로 항목 링크 내보내기

이 문서에서는 항목 링크 내보내기 유틸리티를 사용하여 Knowledge Catalog (이전 명칭: Dataplex Universal Catalog)에서 Google 시트로 항목 링크 (용어집 용어와 데이터 애셋 간의 관계)를 추출하는 방법을 설명합니다.

항목 링크를 Google Sheets로 내보내 기존 링크를 감사하거나, 메타데이터를 백업하거나, 일괄 업데이트용 템플릿을 준비할 수 있습니다.

시작하기 전에

항목 링크를 Google Sheets로 내보내기 전에 다음 기본 요건을 완료하세요.

서비스 계정 설정

내보내기 유틸리티를 실행하려면 Google Sheets API에 액세스하고 사용자 인증 정보를 가장하는 데 필요한 권한이 있는 서비스 계정을 설정해야 합니다.

  1. 서비스 계정을 식별하거나 만듭니다.

    가져오기 유틸리티를 실행하는 프로젝트에서 기존 서비스 계정을 선택하거나 새 서비스 계정을 만듭니다. 자세한 내용은 서비스 계정 만들기를 참고하세요. 서비스 계정 이메일(예: SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com)을 기록해 둡니다.

  2. 서비스 계정 가장을 구성합니다.

    내보내기 유틸리티 스크립트를 로컬로 실행하려면 사용자 계정에 서비스 계정을 가장할 수 있는 권한이 있어야 합니다. 사용자 계정에 서비스 계정에 대한 서비스 계정 토큰 생성자 역할 (roles/iam.serviceAccountTokenCreator)을 부여합니다.

    자세한 내용은 서비스 계정에 대한 액세스 관리를 참고하세요.

  3. 서비스 계정 Editor에 Google Sheets에 대한 액세스 권한을 부여합니다.

    가져오기 프로세스에 사용할 Google 시트를 열고 공유를 클릭한 다음 서비스 계정 이메일을 Editor로 추가합니다. 이 권한을 사용하면 서비스 계정이 시트에서 데이터를 읽거나 시트에 데이터를 쓸 수 있습니다.

필요한 역할

서비스 계정에 Google 시트로 항목 링크를 내보내는 데 필요한 권한이 있는지 확인하려면 관리자에게 서비스 계정에 다음 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

관리자는 커스텀 역할이나 다른 사전 정의된 역할을 통해 서비스 계정에 필요한 권한을 부여할 수도 있습니다.

API 사용 설정

항목 링크를 내보내려면 프로젝트에서 다음 API를 사용 설정하세요.

API 사용 설정에 필요한 역할

API를 사용 설정하려면 serviceusage.services.enable 권한이 포함된 서비스 사용량 관리자 IAM 역할(roles/serviceusage.serviceUsageAdmin)이 필요합니다. 역할 부여 방법 알아보기

API 사용 설정

Git 저장소 설정

dataplex-labs 저장소를 복제합니다.

git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import/dataplex-glossary/export

종속 항목 설치

필수 Python 종속 항목을 설치합니다.

pip3 install -r requirements.txt
cd dataplex-glossary

패키지 설치에 문제가 발생하면 새 Python 개발 환경을 설정하세요.

서비스 계정 가장 인증 및 구성

Google Cloud CLI를 초기화하고 서비스 계정 가장을 사용하여 애플리케이션 기본 사용자 인증 정보 (ADC)로 인증합니다.

# Set your service account email address
SA_EMAIL="SERVICE_ACCOUNT_EMAIL"

# Authenticate ADC using service account impersonation and required scopes
gcloud init
gcloud auth login
gcloud auth application-default login \
  --impersonate-service-account="${SA_EMAIL}" \
  --scopes="https://www.googleapis.com/auth/spreadsheets"

SERVICE_ACCOUNT_EMAIL을 서비스 계정 이메일 ID로 바꿉니다. 예를 들면 다음과 같습니다.

SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

내보내기 대상 Google 시트 설정

빈 Google 시트를 만들거나 기존 시트를 사용합니다. 내보내기 스크립트는 첫 번째 시트에 씁니다. 서비스 계정에 Google Sheets에 대한 Editor 액세스 권한을 부여했는지 확인합니다.

환경 변수 설정

다음 환경 변수를 설정합니다.

# Set your glossary URL
export GLOSSARY_URL="GLOSSARY_URL"

# Set your Google Sheet URL
export SPREADSHEET_URL="GOOGLE_SHEET_URL"

# Set the project ID
export USER_PROJECT="USER_PROJECT"

항목 링크를 Google 시트로 내보내기

용어집의 항목 링크를 Google 시트로 내보내려면 다음 스크립트를 실행합니다.

cd export
python3 entrylinks-export.py \
  --glossary-url="$GLOSSARY_URL" \
  --spreadsheet-url="$SPREADSHEET_URL" \
  --user-project="$USER_PROJECT"

로컬 실행 경로의 logs/ 디렉터리에서 실행 로그를 검토할 수 있습니다. 이러한 로그는 전송 프로세스를 감사하고 건너뛴 항목이나 서식 경고를 식별하는 데 도움이 됩니다.

내보낸 항목 링크 데이터 확인

내보내기 스크립트는 Google Sheets에 다음 열을 채웁니다.

열 헤더 설명
entry_link_type 항목 링크 유형 (definition, related 또는 synonym)입니다.
source_entry 소스 항목의 전체 리소스 경로입니다.
target_entry 타겟 항목의 전체 리소스 경로입니다.
source_path 정의 링크의 열 또는 필드 경로입니다.

다음 단계