용어집 및 항목 링크 가져오기 및 내보내기 정보

이 문서에서는 Knowledge Catalog (이전의 Dataplex Universal Catalog)에서 비즈니스 용어집과 항목 링크를 가져오고 내보내는 방법을 간략하게 설명합니다.

Knowledge Catalog 비즈니스 용어집을 사용하면 공통 비즈니스 어휘를 정의하고 이러한 용어를 실제 데이터 애셋과 연결할 수 있습니다. 카탈로그가 커짐에 따라 콘솔에서 이러한 용어와 관계를 개별적으로 관리하기가 어려워질 수 있습니다.Google Cloud

비즈니스 용어집을 대규모로 관리하려면 용어집(카테고리 및 용어)과 항목 링크 (용어와 데이터 애셋 간의 연결)를 일괄적으로 가져오고 내보내면 됩니다.

용어

가져오기 및 내보내기 유틸리티를 사용하기 전에 다음 주요 구성요소를 숙지하세요.

  • 용어집 리소스: 비즈니스 어휘를 설정하는 카테고리와 용어로 구성됩니다.
  • 항목 링크: 리소스 간의 관계 또는 연결입니다. Knowledge Catalog는 다음과 같은 세 가지 유형의 항목 링크를 지원합니다.

    • definition: 용어집 용어를 특정 데이터 애셋(예: BigQuery 열)과 연결합니다.
    • related: 두 개의 관련 용어집 용어 간의 관계를 설정합니다.
    • synonym: 두 개의 동의어 용어집 용어 간의 관계를 설정합니다.

용어집 및 항목 링크를 가져오고 내보내는 방법

Knowledge Catalog는 용어집을 일괄적으로 관리하는 두 가지 기본 방법을 지원합니다. 자동화 요구사항 및 선호하는 인터페이스에 가장 적합한 방법을 선택하세요.

  • JSON 기반 메타데이터 가져오기
  • 가져오기 및 내보내기를 위한 Google Sheets 기반 유틸리티

JSON 기반 메타데이터 가져오기

완전 관리형 기본 제공 Knowledge Catalog 메커니즘입니다. Dataplex API를 사용하여 JSON 형식의 메타데이터 파일에 정의된 용어집 용어와 연결을 가져옵니다.

사용 사례 예: 외부 엔터프라이즈 데이터베이스에서 용어를 직접 동기화하는 등 일일 예약 데이터 파이프라인의 일부로 Knowledge Catalog 메타데이터를 자동으로 업데이트합니다.

자세한 내용은 JSON 파일을 사용하여 용어집 및 항목 링크 가져오기를 참조하세요.

가져오기 및 내보내기를 위한 Google Sheets 기반 유틸리티

dataplex-labs 저장소에 제공되는 스크립트 기반 오픈소스 접근 방식입니다. Python 스크립트를 사용하여 Google Sheets와 Knowledge Catalog 간에 용어집 메타데이터를 동기화합니다.

사용 사례 예: 데이터 거버넌스팀에서 기술자가 아닌 비즈니스 이해관계자와 함께 수십 개의 새로운 비즈니스 용어를 공동으로 작성하고 검토하려고 합니다. 관리자가 스크립트를 실행하여 용어를 Knowledge Catalog에 일괄적으로 업로드하기 전에 모든 사용자가 Google Sheets에서 용어를 수정하고, 용어에 댓글을 달고, 용어를 승인할 수 있도록 팀에서 이 스프레드시트 기반 방법을 사용합니다.

자세한 내용은 다음 문서를 참조하세요.

일반적인 사용 사례: Google Sheets를 사용한 왕복 편집

일반적인 관리 워크플로는 왕복 편집을 실행하는 것입니다. 여기에는 기존 카탈로그 설정을 내보내고, 일괄적으로 수정하고, 이러한 변경사항을 Knowledge Catalog에 다시 적용하는 작업이 포함됩니다.

다음 워크플로는 이 프로세스를 실행하는 방법을 보여줍니다.

  1. Knowledge Catalog에서 Google Sheets로 기존 메타데이터를 내보냅니다.

    용어집 내보내기항목 링크 내보내기 유틸리티를 사용하여 기존 용어집 구조와 항목 링크를 Google Sheets로 추출합니다.

  2. Google Sheets 내에서 메타데이터를 수정합니다.

    Google Sheets에서 필요한 변경사항을 적용합니다. 중복 행을 방지하기 위해 내보내는 동안 대칭 링크 (예: synonymrelated 항목 링크)가 단일 방향으로 간소화되므로 한 번만 관리하면 됩니다.

    필요한 열 스키마에 따라 각 시트에 새 행을 추가할 수 있습니다. 행에서 설명 또는 표시 이름과 같은 세부정보를 직접 수정할 수도 있습니다.

  3. Google Sheets에서 Knowledge Catalog로 변경사항을 스테이징하고 가져옵니다.

    먼저 용어집 가져오기 유틸리티를 실행합니다. 이렇게 하면 용어를 연결하기 전에 비즈니스 용어집에서 새 용어 또는 카테고리가 성공적으로 생성됩니다.

    항목 링크 가져오기 유틸리티를 실행합니다. 이 유틸리티는 업데이트된 연결을 읽고, Cloud Storage 버킷에 스테이징하고, 새로 업데이트된 용어집에 definition, related, synonym 링크를 적용합니다.

다음 단계