비즈니스 용어를 Google 시트로 내보내기

이 문서에서는 비즈니스 용어집 내보내기 유틸리티를 사용하여 Knowledge Catalog (이전의 Dataplex Universal Catalog)에서 용어집, 카테고리, 용어를 추출하여 대량 관리 및 보고를 위해 Google Sheets로 가져오는 방법을 설명합니다.

glossary_export 유틸리티는 Knowledge Catalog 비즈니스 용어집에서 메타데이터를 가져오고 설명, 데이터 스튜어드, 라벨을 비롯한 구조화된 스키마로 Google Sheets를 채웁니다.

시작하기 전에

용어집을 내보내기 전에 다음의 사전 요구사항을 완료하세요.

서비스 계정 설정

내보내기 유틸리티를 실행하려면 Google Sheets API에 액세스하고 사용자 인증 정보를 가장하는 데 필요한 권한이 있는 서비스 계정을 설정해야 합니다.

  1. 서비스 계정을 식별하거나 만듭니다.

    가져오기 유틸리티를 실행하는 프로젝트에서 기존 서비스 계정을 선택하거나 새 서비스 계정을 만듭니다. 자세한 내용은 서비스 계정 만들기를 참조하세요. 서비스 계정 이메일 (예: SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com)을 기록해 둡니다.

  2. 서비스 계정 가장을 구성합니다.

    내보내기 유틸리티 스크립트를 로컬로 실행하려면 사용자 계정에 서비스 계정을 가장할 수 있는 권한이 있어야 합니다. 사용자 계정에 서비스 계정에 대한 서비스 계정 토큰 생성자 역할 (roles/iam.serviceAccountTokenCreator)을 부여합니다.

    자세한 내용은 서비스 계정에 대한 액세스 관리를 참조하세요.

  3. 서비스 계정에 Google Sheets에 대한 Editor 액세스 권한을 부여합니다.

    가져오기 프로세스에 사용할 Google Sheets를 열고 공유를 클릭한 후 서비스 계정 이메일을 Editor로 추가합니다. 이 권한을 사용하면 서비스 계정에서 시트를 읽거나 시트에 데이터를 쓸 수 있습니다.

필요한 역할

서비스 계정에 용어집을 Google Sheets로 내보내는 데 필요한 권한이 있는지 확인하려면 관리자에게 서비스 계정에 다음 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

관리자는 커스텀 역할이나 다른 사전 정의된 역할을 통해 서비스 계정에 필요한 권한을 부여할 수도 있습니다.

API 사용 설정

용어집을 내보내려면 프로젝트에서 다음 API를 사용 설정하세요.

API 사용 설정에 필요한 역할

API를 사용 설정하려면 serviceusage.services.enable 권한이 포함된 서비스 사용량 관리자 IAM 역할(roles/serviceusage.serviceUsageAdmin)이 필요합니다. 역할 부여 방법 알아보기.

API 사용 설정

Git 저장소 설정

dataplex-labs 저장소를 클론합니다.

git clone https://github.com/GoogleCloudPlatform/dataplex-labs.git
cd dataplex-labs/dataplex-quickstart-labs/00-resources/scripts/python/business-glossary-import/dataplex-glossary/export

종속 항목 설치

필요한 Python 종속 항목을 설치합니다.

pip3 install -r requirements.txt

패키지 설치에 문제가 발생하면 새 Python 개발 환경을 설정하세요.

서비스 계정 가장 인증 및 구성

Google Cloud CLI를 초기화하고 서비스 계정 가장을 사용하여 애플리케이션 기본 사용자 인증 정보 (ADC)로 인증합니다.

# Set your service account email address
SA_EMAIL="SERVICE_ACCOUNT_EMAIL"

# Authenticate ADC using service account impersonation and required scopes
gcloud auth application-default login \
  --impersonate-service-account="${SA_EMAIL}" \
  --scopes="https://www.googleapis.com/auth/spreadsheets"

SERVICE_ACCOUNT_EMAIL을 서비스 계정 이메일 ID로 바꿉니다. 예를 들면 다음과 같습니다.

SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

내보내기 대상 Google Sheets 설정

빈 Google Sheets를 만들거나 기존 Google Sheets를 사용합니다. 내보내기 스크립트는 첫 번째 시트에 씁니다. 서비스 계정에 Google Sheets에 대한 Editor 액세스 권한을 부여했는지 확인합니다.

용어집을 Google Sheets로 내보내기

glossary-export.py 스크립트를 실행합니다. 실행 중에 유틸리티에서 내보낼 대상 Google Sheets와 특정 용어집 이름을 묻는 메시지가 표시됩니다.

python3 glossary-export.py

로컬 실행 경로의 logs/ 디렉터리에서 실행 로그를 검토할 수 있습니다. 이러한 로그는 전송 프로세스를 감사하고 건너뛴 항목 또는 형식 경고를 식별하는 데 도움이 됩니다.

내보낸 용어집 데이터 확인

내보내기 스크립트는 Google Sheets를 다음 열로 채웁니다. 내보낸 데이터를 확인합니다.

필드 설명
id 용어집 내의 용어 또는 카테고리의 고유 식별자입니다.
parent 상위 카테고리의 ID입니다.
display_name 용어 또는 카테고리의 표시 이름입니다.
description 용어 또는 카테고리에 대한 간략한 설명입니다.
overview 용어 또는 카테고리에 대한 서식 있는 텍스트 설명입니다 (HTML 태그 지원).
type 행 유형: TERM 또는 CATEGORY.
contact1_email 용어 또는 카테고리의 기본 데이터 스튜어드의 이메일 주소입니다.
contact1_name 용어 또는 카테고리의 기본 데이터 스튜어드의 이름입니다.
contact2_email 용어 또는 카테고리의 보조 데이터 스튜어드의 이메일 주소입니다.
contact2_name 용어 또는 카테고리의 보조 데이터 스튜어드의 이름입니다.
label1_key 첫 번째 할당된 라벨의 키입니다.
label1_value 첫 번째 할당된 라벨의 값입니다.
label2_key 두 번째 할당된 라벨의 키입니다.
label2_value 두 번째 할당된 라벨의 값입니다.

다음 단계