Enterprise Knowledge Graph 개요

Enterprise Knowledge Graph는 효율적이고 유용한 방식으로 데이터의 통합, 표준화, 조정을 통해 고립된 정보를 조직의 지식으로 구성합니다.

Entity Reconciliation API

Entity Reconciliation API는 표 형식 데이터를 위한 경량의 AI 기반 시맨틱 클러스터링 및 중복 삭제 서비스입니다. Google 핵심 엔티티 확인 엔진을 래핑하는 독립형 API입니다. 고객이 데이터를 조정하고 결합하거나 데이터를 하나 이상의 서드 파티 데이터 세트와 결합할 수 있습니다.

주요 기능은 다음과 같습니다.

  • Google 데이터로 학습된 최첨단 품질의 사전 학습된 모델
  • 지오코딩을 비롯한 기본 제공 항목 보강
  • 최대 수십억 개의 노드와 수조 개의 에지가 있는 그래프를 처리하는 Google 규모의 클러스터링 및 조정
  • 안정적인 머신 ID (MID)는 각 엔티티 클러스터의 고유 식별자입니다.
  • 최대 10개의 BigQuery 테이블을 기본적으로 지원합니다.

기본 원리

Enterprise Knowledge Graph 개념

관계형 데이터베이스에서 매칭은 주로 고객 ID와 같이 엄격하게 관리되는 키를 통해 이루어집니다. 일부에서는 퍼지 일치를 지원합니다(예: 'Robert Smith'와 'Bob Smith'). 그래프에서 매칭은 유사 텍스트, 공통 관계, 항목 유형, 속성의 조합을 사용하여 발생합니다. 이는 이기종 시스템의 혼합에서 데이터를 결합할 때 유용합니다.

Entity Reconciliation API는 공통 스키마에 매핑된 엔티티 유형 및 파일 집합이 주어지면 소스 BigQuery 테이블에서 데이터를 읽습니다. 그런 다음 지식 추출을 실행하여 입력 관계형 데이터를 지식 그래프 표현과 같은 RDF 트리플로 변환합니다. 그러면 Google 항목 조정 엔진이 그래프를 빌드하여 항목을 여러 그룹으로 클러스터링합니다 (동일한 그룹의 항목은 일치하는 것으로 간주됨). 마지막 단계는 연결 결과 (일치 및 불일치)를 고객이 지정한 BigQuery 테이블에 새 고유 식별자 열 (MID)의 형태로 출력하는 것입니다.

Google Knowledge Graph Search API

키워드로 검색하거나 Google 지식 그래프에서 ID로 항목을 조회하는 것은 Google Knowledge Graph Search API를 사용합니다. API는 표준 schema.org 유형을 사용하며 JSON-LD 사양을 준수합니다.

API를 사용하여 다음 작업을 수행합니다.

  • 조직, 제품, 위치, 책, 영화 등 다양한 항목에 대해 항목 해결을 실행합니다.
  • 비공개 항목을 전 세계적으로 고유한 Cloud Knowledge Graph 머신 ID (MID)에 연결합니다.
  • 특정 기준과 일치하는 가장 주목할 만한 항목의 순위가 매겨진 목록을 가져옵니다.
  • Google 지식 그래프 항목을 사용하여 콘텐츠에 주석을 달고 정리합니다.
  • Google 지식 정보 검색 API에서 반환하는 Google 장소 ID와 같은 추가 ID를 사용하여 더 광범위한 데이터 생태계에 연결합니다.
  • Cloud Vision API, Cloud Natural Language API, Cloud Video Intelligence API와 같은 다른 Google Cloud API에서 반환된 MID의 엔티티를 검색합니다.

Google Knowledge Graph Search API 버전

Google Knowledge Graph Search API는 다음 두 가지 버전으로 제공됩니다.

  • Basic
  • Advanced

두 버전 모두 항목 검색 및 조회를 지원합니다. 또한 Google Cloud에서 빌드한 동일한 기본 지식 그래프 항목을 제공합니다. Enterprise 버전에는 Google Place ID에 대한 링크, 추가 데이터 범위와 같은 추가 기능이 포함됩니다.

새 프로젝트를 계획 중이라면 새로운 기능과 서비스 개선사항을 활용할 수 있도록 Cloud Knowledge Graph Advanced edition으로 애플리케이션을 빌드하세요. Basic 버전은 계속 사용할 수 있지만 새로운 기능, 높은 QPS 또는 추가 보안 및 규정 준수 표준은 지원되지 않습니다.

두 버전을 비교하려면 Basic 버전과 Advanced 버전 비교를 참고하세요.