Cuando creas un servicio de Dataproc Metastore, debes elegir usar uno de los siguientes protocolos de extremo:
- El protocolo de Apache Thrift
- El protocolo de gRPC
Este protocolo define cómo tus clientes de Hive Metastore acceden a los metadatos almacenados en tu servicio de Dataproc Metastore. Esta elección también puede afectar las funciones que puedes integrar y usar con tu servicio.
En esta página, se explican las diferencias conceptuales entre cada uno de los protocolos de extremos.
Apache Thrift
El protocolo Apache Thrift es la opción predeterminada heredada que se preselecciona cuando creas un servicio de Dataproc Metastore.
El protocolo Thrift solo admite Kerberos para los servicios de una sola región configurados con intercambio de tráfico entre VPCs. No admite Kerberos para ningún servicio configurado con Private Service Connect.
Si necesitas Kerberos, te recomendamos que uses el protocolo gRPC. El protocolo gRPC admite Kerberos para los servicios de una sola región con todas las configuraciones de redes.
Si usas un extremo de Thrift, puedes elegir el número de puerto al que se conecta la interfaz de Thrift. De forma predeterminada, se usa el número de puerto 9083.
Después de elegir el protocolo Thrift
Después de crear un almacén de metadatos de Dataproc con Thrift, puedes conectarte a él desde un clúster de Dataproc o un clúster autoadministrado. Luego, tu clúster usará Dataproc Metastore como su almacén de metadatos de Hive.
gRPC
El protocolo gRPC es la opción moderna, portátil y de alto rendimiento que debes seleccionar de forma explícita cuando creas un servicio de Dataproc Metastore.
Si eliges el protocolo gRPC, no podrás actualizarlo a Thrift más adelante. Si deseas migrar de gRPC a Thrift, debes crear un nuevo Dataproc Metastore.
Si usas un extremo de gRPC, no puedes elegir el número de puerto que usa la interfaz de gRPC. En su lugar, el número de puerto 443 se asigna automáticamente a tu interfaz.
Después de elegir el protocolo gRPC
Después de crear un Dataproc Metastore con el protocolo de extremo de gRPC, debes otorgar funciones de IAM adicionales. Luego, puedes conectarte a él desde un clúster de Dataproc. Luego, tu clúster usará Dataproc Metastore como su almacén de metadatos de Hive.