이 문서에서는 항목 링크 내보내기 유틸리티를 사용하여 Knowledge Catalog (이전 명칭: Dataplex Universal Catalog)에서 Google 시트로 항목 링크 (용어집 용어와 데이터 애셋 간의 관계)를 추출하는 방법을 설명합니다.
항목 링크를 Google Sheets로 내보내 기존 링크를 감사하거나, 메타데이터를 백업하거나, 일괄 업데이트용 템플릿을 준비할 수 있습니다.
시작하기 전에
항목 링크를 Google Sheets로 내보내기 전에 다음 기본 요건을 완료하세요.
서비스 계정 설정
내보내기 유틸리티를 실행하려면 Google Sheets API에 액세스하고 사용자 인증 정보를 가장하는 데 필요한 권한이 있는 서비스 계정을 설정해야 합니다.
서비스 계정을 식별하거나 만듭니다.
가져오기 유틸리티를 실행하는 프로젝트에서 기존 서비스 계정을 선택하거나 새 서비스 계정을 만듭니다. 자세한 내용은 서비스 계정 만들기를 참고하세요. 서비스 계정 이메일(예:
SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com)을 기록해 둡니다.서비스 계정 가장을 구성합니다.
내보내기 유틸리티 스크립트를 로컬로 실행하려면 사용자 계정에 서비스 계정을 가장할 수 있는 권한이 있어야 합니다. 사용자 계정에 서비스 계정에 대한 서비스 계정 토큰 생성자 역할 (
roles/iam.serviceAccountTokenCreator)을 부여합니다.자세한 내용은 서비스 계정에 대한 액세스 관리를 참고하세요.
서비스 계정
Editor에 Google Sheets에 대한 액세스 권한을 부여합니다.가져오기 프로세스에 사용할 Google 시트를 열고 공유를 클릭한 다음 서비스 계정 이메일을
Editor로 추가합니다. 이 권한을 사용하면 서비스 계정이 시트에서 데이터를 읽거나 시트에 데이터를 쓸 수 있습니다.
필요한 역할
서비스 계정에 Google 시트로 항목 링크를 내보내는 데 필요한 권한이 있는지 확인하려면 관리자에게 서비스 계정에 다음 IAM 역할을 부여해 달라고 요청하세요.
- 프로젝트에 대한 Dataplex 관리자 (
roles/dataplex.admin) - 프로젝트에 대한 Dataplex 카탈로그 관리자 (
roles/dataplex.catalogAdmin) - 프로젝트에 대한 Dataplex 카탈로그 편집자 (
roles/dataplex.catalogEditor)
역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
관리자는 커스텀 역할이나 다른 사전 정의된 역할을 통해 서비스 계정에 필요한 권한을 부여할 수도 있습니다.
API 사용 설정
항목 링크를 내보내려면 프로젝트에서 다음 API를 사용 설정하세요.
API 사용 설정에 필요한 역할
API를 사용 설정하려면 serviceusage.services.enable 권한이 포함된 서비스 사용량 관리자 IAM 역할(roles/serviceusage.serviceUsageAdmin)이 필요합니다. 역할 부여 방법 알아보기
Git 저장소 설정
dataplex-labs 저장소를 복제합니다.
git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import/dataplex-glossary/export
종속 항목 설치
필수 Python 종속 항목을 설치합니다.
pip3 install -r requirements.txt cd dataplex-glossary
패키지 설치에 문제가 발생하면 새 Python 개발 환경을 설정하세요.
서비스 계정 가장 인증 및 구성
Google Cloud CLI를 초기화하고 서비스 계정 가장을 사용하여 애플리케이션 기본 사용자 인증 정보 (ADC)로 인증합니다.
# Set your service account email address SA_EMAIL="SERVICE_ACCOUNT_EMAIL" # Authenticate ADC using service account impersonation and required scopes gcloud init gcloud auth login gcloud auth application-default login \ --impersonate-service-account="${SA_EMAIL}" \ --scopes="https://www.googleapis.com/auth/spreadsheets"
SERVICE_ACCOUNT_EMAIL을 서비스 계정 이메일 ID로 바꿉니다. 예를 들면 다음과 같습니다.
SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
내보내기 대상 Google 시트 설정
빈 Google 시트를 만들거나 기존 시트를 사용합니다. 내보내기 스크립트는 첫 번째 시트에 씁니다. 서비스 계정에 Google Sheets에 대한 Editor 액세스 권한을 부여했는지 확인합니다.
환경 변수 설정
다음 환경 변수를 설정합니다.
# Set your glossary URL export GLOSSARY_URL="GLOSSARY_URL" # Set your Google Sheet URL export SPREADSHEET_URL="GOOGLE_SHEET_URL" # Set the project ID export USER_PROJECT="USER_PROJECT"
항목 링크를 Google 시트로 내보내기
용어집의 항목 링크를 Google 시트로 내보내려면 다음 스크립트를 실행합니다.
cd export python3 entrylinks-export.py \ --glossary-url="$GLOSSARY_URL" \ --spreadsheet-url="$SPREADSHEET_URL" \ --user-project="$USER_PROJECT"
로컬 실행 경로의 logs/ 디렉터리에서 실행 로그를 검토할 수 있습니다. 이러한 로그는 전송 프로세스를 감사하고 건너뛴 항목이나 서식 경고를 식별하는 데 도움이 됩니다.
내보낸 항목 링크 데이터 확인
내보내기 스크립트는 Google Sheets에 다음 열을 채웁니다.
| 열 헤더 | 설명 |
|---|---|
entry_link_type |
항목 링크 유형 (definition, related 또는 synonym)입니다. |
source_entry |
소스 항목의 전체 리소스 경로입니다. |
target_entry |
타겟 항목의 전체 리소스 경로입니다. |
source_path |
정의 링크의 열 또는 필드 경로입니다. |
다음 단계
- 비즈니스 용어집을 관리하는 방법을 알아보세요.
- Google Sheets에서 항목 링크를 가져오는 방법을 알아보세요.
- 용어집을 Google 시트로 내보내는 방법을 알아보세요.
- 메타데이터 관리에 대해 자세히 알아보세요.