Componente Hive WebHCat opcional do Dataproc

Pode instalar componentes adicionais, como o Hive WebHCat, quando cria um cluster do Dataproc através da funcionalidade Componentes opcionais. Esta página descreve o componente Hive WebHCat.

O componente Hive WebHCat fornece uma API REST para o HCatalog. O serviço REST está disponível na porta 50111 no primeiro nó principal do cluster.

Instale o componente

Instale o componente quando criar um cluster do Dataproc. Pode adicionar componentes a clusters criados com o Dataproc versão 1.3 e posterior.

Consulte as versões do Dataproc suportadas para ver a versão do componente incluída em cada lançamento de imagem do Dataproc.

comando gcloud

Para criar um cluster do Dataproc que inclua o componente Hive WebHCat, use o comando gcloud dataproc clusters create cluster-name com a flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

API REST

O componente Hive WebHCat pode ser especificado através da API Dataproc com SoftwareConfig.Component como parte de um pedido clusters.create.

Consola

  1. Ative o componente.
    • Na Google Cloud consola, abra a página do Dataproc Criar um cluster. O painel Configurar cluster está selecionado.
    • Na secção Components (Componentes), em Optional components (Componentes opcionais), selecione Hive WebHCat e outros componentes opcionais para instalar no cluster.