Dataproc Metastore サービスを作成するときは、次のいずれかのエンドポイント プロトコルを使用する必要があります。
- Apache Thrift プロトコル
- gRPC プロトコル
このプロトコルは、Hive Metastore クライアントが Dataproc Metastore サービスに保存されているメタデータにアクセスする方法を定義します。この選択は、サービスと統合して使用できる機能にも影響します。
このページでは、各エンドポイント プロトコルの概念的な違いについて説明します。
Apache Thrift
Apache Thrift プロトコルは、 Dataproc Metastore サービスを作成するときに事前選択される 従来のデフォルト オプションです。
Thrift プロトコルは、VPC ピアリングで構成された単一リージョン サービスでのみ Kerberos をサポートします。Private Service Connect で構成されたサービスでは Kerberos はサポートされません。
Kerberos が必要な場合は、代わりに gRPC プロトコルを使用することをおすすめします。gRPC プロトコルは、すべてのネットワーク構成で単一リージョン サービスの Kerberos をサポートしています。
Thrift エンドポイントを使用する場合は、Thrift インターフェースが接続するポート番号を選択できます。デフォルトでは、ポート番号 9083 が使用されます。
Thrift プロトコルを選択した後
Thrift を使用して Dataproc Metastore を作成したら、 Managed Service for Apache Spark クラスタまたはセルフマネージド クラスタから接続できます。クラスタは Dataproc Metastore を Hive メタストアとして使用します。
gRPC
gRPC プロトコルは、Dataproc Metastore サービスを作成するときに明示的に選択する必要がある、最新のポータブルで高性能なオプションです。
gRPC プロトコルを選択した場合、後で Thrift に更新することはできません。 gRPC から Thrift に移行する場合は、新しい Dataproc Metastore を作成する必要があります。
gRPC エンドポイントを使用する場合、gRPC インターフェースが使用するポート番号を選択することはできません。代わりに、ポート番号 443 がインターフェースに自動的に割り当てられます。
gRPC プロトコルを選択した後
gRPC エンドポイント プロトコルを使用して Dataproc Metastore を作成したら、 追加の IAM ロールを付与する必要があります。 これで、Managed Service for Apache Spark クラスタから接続できるようになります。クラスタは Dataproc Metastore を Hive メタストアとして使用します。