Dataproc Metastore 엔드포인트 프로토콜 정보

Dataproc Metastore 서비스를 만들 때는 다음 엔드포인트 프로토콜 중 하나를 사용해야 합니다.

  • Apache Thrift 프로토콜
  • gRPC 프로토콜

이 프로토콜은 Hive Metastore 클라이언트가 Dataproc Metastore 서비스에 저장된 메타데이터에 액세스하는 방법을 정의합니다. 이 옵션은 서비스에 통합 및 사용할 수 있는 기능에도 영향을 줍니다.

이 페이지에서는 각 엔드포인트 프로토콜 사이의 개념적 차이점을 설명합니다.

Apache Thrift

Apache Thrift 프로토콜은 Dataproc Metastore 서비스를 만들 때 사전 선택되는 레거시 기본 옵션입니다.

Thrift 프로토콜은 VPC 피어링으로 구성된 단일 리전 서비스에 대해서만 Kerberos를 지원합니다. Private Service Connect로 구성된 서비스의 Kerberos는 지원되지 않습니다.

Kerberos가 필요한 경우 대신 gRPC 프로토콜을 사용하는 것이 좋습니다. gRPC 프로토콜은 모든 네트워킹 구성으로 단일 리전 서비스의 Kerberos를 지원합니다.

Thrift 엔드포인트를 사용하는 경우 Thrift 인터페이스가 연결되는 포트 수를 선택할 수 있습니다. 기본적으로 포트 번호 9083이 사용됩니다.

Thrift 프로토콜 선택 후

Thrift를 사용하여 Dataproc Metastore를 만든 후에는 Dataproc 클러스터 또는 자체 관리형 클러스터에서 연결할 수 있습니다. 그런 후 클러스터에서 Dataproc Metastore가 Hive 메타스토어로 사용됩니다.

gRPC

gRPC 프로토콜은 Dataproc Metastore 서비스를 만들 때 명시적으로 선택해야 하는 최신의 포팅 가능한 고성능 옵션입니다.

gRPC 프로토콜을 선택하면 나중에 이를 Thrift로 업데이트할 수 없습니다. gRPC에서 Thrift로 이동하려면 Dataproc Metastore를 새로 만들어야 합니다.

gRPC 엔드포인트를 사용하는 경우 gRPC 인터페이스에 사용되는 포트 번호를 선택할 수 없습니다. 대신 포트 번호 443이 인터페이스에 자동으로 지정됩니다.

gRPC 프로토콜 선택 후

gRPC 엔드포인트 프로토콜을 사용하여 Dataproc Metastore를 만든 후에는 추가 IAM 역할을 부여해야 합니다. 그런 다음 Dataproc 클러스터에서 연결할 수 있습니다. 그런 후 클러스터에서 Dataproc Metastore가 Hive 메타스토어로 사용됩니다.

다음 단계