Dataproc Metastore エンドポイント プロトコルについて

Dataproc Metastore サービスを作成するときに、次のいずれかのエンドポイント プロトコルを使用するように選択する必要があります。

  • Apache Thrift プロトコル
  • gRPC プロトコル

このプロトコルは、Hive Metastore クライアントが Dataproc Metastore サービスに保存されているメタデータにアクセスする方法を定義します。この選択は、サービスと統合して使用できる機能にも影響します。

このページでは、各エンドポイント プロトコルの概念的な違いについて説明します。

Apache Thrift

Apache Thrift プロトコルは、Dataproc Metastore サービスを作成するときに事前選択される以前のデフォルト オプションです。

Thrift プロトコルは、VPC ピアリングで構成された単一リージョン サービスに対してのみ Kerberos をサポートします。Private Service Connect で構成されたサービスでは、Kerberos はサポートされていません。

Kerberos が必要な場合は、代わりに gRPC プロトコルを使用することをおすすめします。gRPC プロトコルは、すべてのネットワーキング構成で単一リージョン サービスの Kerberos をサポートしています。

Thrift エンドポイントを使用する場合は、Thrift インターフェースが接続するポート番号を選択できます。デフォルトでは、ポート番号 9083 が使用されます。

Thrift プロトコルを選択した後

Thrift を使用して Dataproc Metastore を作成したら、Dataproc クラスタまたはセルフマネージド クラスタから接続できます。クラスタは、Dataproc Metastore を Hive メタストアとして使用します。

gRPC

gRPC プロトコルは、最新のポータブルな高パフォーマンス オプションです。Dataproc Metastore サービスを作成するときに明示的に選択する必要があります。

gRPC プロトコルを選択した場合、後で Thrift に更新することはできません。gRPC から Thrift に移行する場合は、新しい Dataproc Metastore を作成する必要があります。

gRPC エンドポイントを使用する場合、gRPC インターフェースが使用するポート番号を選択することはできません。代わりに、ポート番号 443 がインターフェースに自動的に割り当てられます。

gRPC プロトコルを選択した後

gRPC エンドポイント プロトコルを使用して Dataproc Metastore を作成したら、追加の IAM ロールを付与する必要があります。これで、Dataproc クラスタから接続できるようになります。クラスタは、Dataproc Metastore を Hive メタストアとして使用します。

次のステップ