É possível instalar outros componentes, como o Zeppelin, ao criar um cluster do Managed Service for Apache Spark usando o recurso Componentes opcionais. Nesta página, você conhecerá o componente Zeppelin.
O componente Zeppelin Notebook
é um notebook baseado na Web para análise de dados interativos. A IU da Web do Zeppelin está disponível na porta 8080 do primeiro nó mestre do cluster.
Por padrão, os notebooks são salvos no Cloud Storage
no bucket de preparação do Managed Service for Apache Spark, que é especificado pelo usuário ou
criado automaticamente
na criação do cluster. O local pode ser alterado no momento da criação do cluster
por meio da
zeppelin:zeppelin.notebook.gcs.dir propriedade.
Instalar o componente
Instale o componente ao criar um cluster do Managed Service for Apache Spark. Os componentes podem ser adicionados a clusters criados com o Managed Service for Apache Spark versão 1.3 e mais recentes.
Consulte Versões compatíveis do Dataproc para a versão do componente incluída em cada versão de imagem do Managed Service for Apache Spark.
Comando gcloud
Para criar um cluster do Managed Service for Apache Spark que inclua o componente Zeppelin,
use o
comando gcloud dataproc clusters create cluster-name
com a flag --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
Especifique o componente Zeppelin por meio da API do Managed Service for Apache Spark usando SoftwareConfig.Component como parte de uma clusters.create.Console
- Ative o componente e o gateway de componentes.
- No Google Cloud console, abra a página Criar um cluster do Managed Service for Apache Spark . O painel "Configurar cluster" está selecionado.
- Na seção "Componentes:"
- Em "Componentes opcionais", selecione Zeppelin e outros componentes opcionais para instalar no cluster.
- Em "Gateway de componentes", selecione "Ativar gateway do componente" (consulte Visualizar e acessar URLs do gateway de componentes).
Abrir o notebook Zeppelin
Consulte Visualizar e acessar URLs do Gateway de componentes e clique nos links do Gateway de Componentes no Google Cloud console para abrir a UI do notebook Zeppelin em execução no nó mestre do cluster em seu navegador local.