Componente opcional do Zeppelin do Dataproc

Pode instalar componentes adicionais, como o Zeppelin, quando cria um cluster do Dataproc através da funcionalidade Componentes opcionais. Esta página descreve o componente Zeppelin.

O componente Zeppelin Notebook é um bloco de notas baseado na Web para estatísticas de dados interativas. A IU Web do Zeppelin está disponível na porta 8080 no primeiro nó principal do cluster.

Por predefinição, os blocos de notas são guardados no Cloud Storage no contentor de preparação do Dataproc, que é especificado pelo utilizador ou criado automaticamente quando o cluster é criado. Pode alterar a localização no momento da criação do cluster através da propriedade zeppelin:zeppelin.notebook.gcs.dir.

Instale o componente

Instale o componente quando criar um cluster do Dataproc. Pode adicionar componentes a clusters criados com o Dataproc versão 1.3 e posterior.

Consulte as versões do Dataproc suportadas para ver a versão do componente incluída em cada lançamento de imagem do Dataproc.

comando gcloud

Para criar um cluster do Dataproc que inclua o componente Zeppelin, use o comando gcloud dataproc clusters create cluster-name com a flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

API REST

O componente Zeppelin pode ser especificado através da API Dataproc com SoftwareConfig.Component como parte de um pedido clusters.create.

Consola

  1. Ative o componente e o gateway de componentes.
    • Na Google Cloud consola, abra a página do Dataproc Criar um cluster. O painel Configurar cluster está selecionado.
    • Na secção Componentes:
      • Em Componentes opcionais, selecione o Zeppelin e outros componentes opcionais para instalar no cluster.
      • Em Component Gateway, selecione Enable component gateway (consulte Ver e aceder aos URLs do Component Gateway).

Abra o notebook do Zeppelin

Consulte o artigo Ver e aceder aos URLs do gateway de componentes para clicar nos links do gateway de componentes na Google Cloud consola para abrir a IU do bloco de notas do Zeppelin em execução no nó principal do cluster no seu navegador local.