Tentang protokol endpoint Dataproc Metastore

Saat membuat layanan Dataproc Metastore, Anda harus memilih untuk menggunakan salah satu protokol endpoint berikut:

  • Protokol Apache Thrift
  • Protokol gRPC

Protokol ini menentukan cara klien Hive Metastore Anda mengakses metadata yang disimpan di layanan Dataproc Metastore Anda. Pilihan ini juga dapat memengaruhi fitur yang dapat Anda integrasikan dan gunakan dengan layanan Anda.

Halaman ini menjelaskan perbedaan konseptual antara setiap protokol endpoint.

Apache Thrift

Protokol Apache Thrift adalah opsi default lama yang telah dipilih sebelumnya saat Anda membuat layanan Dataproc Metastore.

Protokol Thrift hanya mendukung Kerberos untuk layanan satu region yang dikonfigurasi dengan peering VPC. Kerberos tidak didukung untuk layanan apa pun yang dikonfigurasi dengan Private Service Connect.

Jika Anda memerlukan Kerberos, sebaiknya gunakan protokol gRPC. Protokol gRPC mendukung Kerberos untuk layanan satu region dengan semua konfigurasi jaringan.

Jika menggunakan endpoint Thrift, Anda dapat memilih nomor port yang terhubung ke antarmuka Thrift. Secara default, nomor port 9083 digunakan.

Setelah memilih protokol Thrift

Setelah membuat Dataproc Metastore menggunakan Thrift, Anda dapat terhubung ke Dataproc Metastore dari cluster Dataproc atau cluster yang dikelola sendiri. Cluster Anda kemudian menggunakan Dataproc Metastore sebagai metastore Hive-nya.

gRPC

Protokol gRPC adalah opsi berperforma tinggi, portabel, dan modern yang harus Anda pilih secara eksplisit saat membuat layanan Dataproc Metastore.

Jika memilih protokol gRPC, Anda tidak dapat mengupdatenya ke Thrift di lain waktu. Jika ingin beralih dari gRPC ke Thrift, Anda harus membuat Dataproc Metastore baru.

Jika menggunakan endpoint gRPC, Anda tidak dapat memilih nomor port yang digunakan antarmuka gRPC. Sebagai gantinya, nomor port 443 akan otomatis ditetapkan ke antarmuka Anda.

Setelah memilih protokol gRPC

Setelah membuat Dataproc Metastore menggunakan protokol endpoint gRPC, Anda harus memberikan peran IAM tambahan. Setelah itu, Anda dapat terhubung ke cluster dari cluster Dataproc. Cluster Anda kemudian menggunakan Dataproc Metastore sebagai metastore Hive-nya.

Langkah berikutnya