Componente opcional de Hive WebHCat del servicio administrado para Apache Spark

Puedes instalar componentes adicionales, como Hive WebHCat, cuando creas un clúster de Managed Service for Apache Spark con la función de componentes opcionales. En esta página, se describe el componente Hive WebHCat.

El componente Hive WebHCat proporciona una API de REST para HCatalog. El servicio de REST está disponible en el puerto 50111 del primer nodo principal del clúster.

Instala el componente

Instala el componente cuando crees un clúster de Managed Service for Apache Spark. Los componentes se pueden agregar a los clústeres creados con Managed Service for Apache Spark versión 1.3 y las posteriores.

Consulta las versiones compatibles de Managed Service for Apache Spark para la versión del componente incluida en cada versión de la imagen de Managed Service for Apache Spark.

Comando de gcloud

Para crear un clúster de Managed Service for Apache Spark que incluya el componente de Hive WebHCat, usa el comando gcloud dataproc clusters create cluster-name con la marca --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

API de REST

El componente Hive WebHCat se puede especificar con la API de Managed Service for Apache Spark mediante SoftwareConfig.Component como parte de una solicitud clusters.create.

Console

  1. Habilita el componente.
    • En la Google Cloud consola, abre la página Create a cluster (Crear un clúster) de Managed Service for Apache Spark. Se selecciona el panel Configurar clúster.
    • En la sección Componentes, en Componentes opcionales, selecciona Hive WebHCat y otros componentes opcionales para instalar en tu clúster.