Puedes instalar componentes adicionales, como Hive WebHCat, cuando creas un clúster de Managed Service for Apache Spark con la función de componentes opcionales. En esta página, se describe el componente Hive WebHCat.
El componente
Hive WebHCat proporciona una API de REST para HCatalog. El servicio de REST está disponible en el puerto 50111 del primer nodo principal del clúster.
Instala el componente
Instala el componente cuando crees un clúster de Managed Service for Apache Spark. Los componentes se pueden agregar a los clústeres creados con Managed Service for Apache Spark versión 1.3 y las posteriores.
Consulta las versiones compatibles de Managed Service for Apache Spark para la versión del componente incluida en cada versión de la imagen de Managed Service for Apache Spark.
Comando de gcloud
Para crear un clúster de Managed Service for Apache Spark que incluya el componente de Hive WebHCat,
usa el
comando gcloud dataproc clusters create cluster-name
con la marca --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
API de REST
El componente Hive WebHCat se puede especificar con la API de Managed Service for Apache Spark mediante SoftwareConfig.Component como parte de una solicitud clusters.create.Console
- Habilita el componente.
- En la Google Cloud consola, abre la página Create a cluster (Crear un clúster) de Managed Service for Apache Spark. Se selecciona el panel Configurar clúster.
- En la sección Componentes, en Componentes opcionales, selecciona Hive WebHCat y otros componentes opcionales para instalar en tu clúster.