이 문서에서는 Knowledge Catalog (이전 명칭: Dataplex Universal Catalog) 커넥터를 사용하여 외부 서드 파티 데이터 소스에서 Knowledge Catalog로 메타데이터를 가져오는 방법을 설명합니다.
Knowledge Catalog 커넥터는 BigQuery Data Transfer Service를 활용하여 소스 시스템에서 메타데이터를 자동으로 추출하고 Knowledge Catalog 항목 그룹 내 항목에 매핑하는 사전 빌드된 통합을 제공합니다.
커넥터는 다음 유형의 메타데이터를 추출합니다.
- 기술 메타데이터: 데이터베이스, 스키마, 테이블, 뷰 정의
- 운영 메타데이터: 테이블, 뷰, 루틴과 같은 애셋의 생성 및 마지막 업데이트 타임스탬프입니다.
- 비즈니스 메타데이터: 애셋 소유자 및 주석
커넥터를 구성하면 Knowledge Catalog에서 지정한 일정에 따라 메타데이터 가져오기를 실행하여 카탈로그가 소스 시스템과 동기화된 상태로 유지됩니다.
지원되는 데이터 소스
Knowledge Catalog 커넥터를 사용하여 다음 소스에서 메타데이터를 가져올 수 있습니다.
- Oracle
- MySQL
데이터 거버넌스 파트너와의 통합
Knowledge Catalog를 다른 엔터프라이즈 데이터 카탈로그 및 거버넌스 플랫폼과 통합할 수 있습니다. 이러한 통합을 통해 조직의 데이터 환경 전반에서 메타데이터를 검색하고 일관성을 유지할 수 있으므로 Knowledge Catalog에서 메타데이터를 보강하거나 서드 파티 도구 내에서 Knowledge Catalog 메타데이터를 볼 수 있습니다.
다음 파트너는 Knowledge Catalog 통합을 제공합니다.
작동 방식
Knowledge Catalog 커넥터는 BigQuery Data Transfer Service에서 관리하는 전송 구성을 사용하여 데이터 소스에 연결하고, 메타데이터를 추출하고, 사용자가 지정한 Knowledge Catalog 항목 그룹에 메타데이터를 수집합니다.
메타데이터 가져오기가 실행될 때마다 해당 구성으로 관리되는 대상 항목 그룹의 항목이 전체 덮어쓰기됩니다. 소스에 더 이상 없는 메타데이터 객체는 항목 그룹에서 삭제되고 새 객체가 추가됩니다. 커넥터 구성으로 가져오지 않은 항목 그룹의 객체는 영향을 받지 않습니다.
Google Cloud 콘솔의 Knowledge Catalog 섹션에 있는 커넥터 페이지에서 이러한 구성을 구성하고 관리합니다.
용어
이 문서에서는 다음 용어를 사용합니다.
- 메타데이터 가져오기 구성: BigQuery Data Transfer Service를 사용하여 소스에서 메타데이터를 추출하고 Knowledge Catalog로 로드하는 예약된 작업 또는 주문형 작업의 설정입니다.
- 실행: 메타데이터 가져오기 구성의 단일 실행 인스턴스입니다.
- 항목 그룹: 메타데이터 항목을 포함하는 Knowledge Catalog의 리소스입니다. 커넥터를 구성할 때 항목 그룹을 가져온 메타데이터의 대상으로 지정합니다.
- 항목: 테이블이나 뷰와 같은 데이터 애셋을 나타내는 Knowledge Catalog의 리소스입니다.
가격 책정
커넥터를 사용하여 메타데이터를 가져오는 데 Knowledge Catalog 또는 BigQuery Data Transfer Service에서 추가 비용이 청구되지 않습니다.
기타 Knowledge Catalog 사용량 (예: 메타데이터 저장소)에는 표준 요금이 적용됩니다. 자세한 내용은 Knowledge Catalog 가격 책정을 참고하세요.
제한사항
- 메타데이터만 가져오며 소스 테이블 또는 뷰의 기본 데이터는 가져오지 않습니다. 기본 데이터를 전송하려면 BigQuery Data Transfer Service를 사용하면 됩니다.
- 각 실행은 대상 항목 그룹에서 커넥터 관리 항목을 완전히 덮어씁니다. 증분 메타데이터 업데이트는 지원되지 않습니다.
- 실행 기록은 90일 동안 보관됩니다.
다음 단계
- Oracle에서 메타데이터를 가져오는 방법을 알아보세요.
- MySQL에서 메타데이터를 가져오는 방법을 알아보세요.
- 커넥터 구성 관리 방법 알아보기