Componente opcional de Hive WebHCat del servicio administrado para Apache Spark

Puedes instalar componentes adicionales, como Hive WebHCat, cuando creas un clúster de Managed Service para Apache Spark con la función de componentes opcionales. En esta página, se describe el componente Hive WebHCat.

El componente Hive WebHCat proporciona una API de REST para HCatalog. El servicio de REST está disponible en el puerto 50111 del primer nodo principal del clúster.

Instala el componente

Instala el componente cuando crees un clúster de Managed Service para Apache Spark. Los componentes se pueden agregar a los clústeres creados con la versión 1.3 de Managed Service para Apache Spark y las posteriores.

Consulta las versiones compatibles de Managed Service para Apache Spark para la versión del componente incluida en cada versión de la imagen de Managed Service para Apache Spark.

Comando de gcloud

Para crear un clúster de Managed Service para Apache Spark que incluya el componente de Hive WebHCat, usa el comando gcloud dataproc clusters create cluster-name con la marca --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

API de REST

El componente Hive WebHCat se puede especificar con la API de Managed Service para Apache Spark a través de SoftwareConfig.Component como parte de una solicitud clusters.create.

Console

  1. Habilita el componente.
    • En la consola de Google Cloud , abre la página Crear un clúster de Managed Service para Apache Spark. Se selecciona el panel Configurar clúster.
    • En la sección Componentes, en Componentes opcionales, selecciona Hive WebHCat y otros componentes opcionales para instalar en tu clúster.