Componente Zeppelin facoltativo di Managed Service per Apache Spark

Puoi installare componenti aggiuntivi come Zeppelin quando crei un cluster Managed Service per Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Zeppelin.

Il componente Zeppelin Notebook è un notebook basato su web per l'analisi interattiva dei dati. L'interfaccia utente web di Zeppelin è disponibile sulla porta 8080 nel primo nodo master del cluster.

Per impostazione predefinita, i notebook vengono salvati in Cloud Storage nel bucket gestione temporanea Managed Service per Apache Spark, specificato dall'utente o creato automaticamente quando viene creato il cluster. La posizione può essere modificata al momento della creazione del cluster tramite la zeppelin:zeppelin.notebook.gcs.dir proprietà.

Installare il componente

Installa il componente quando crei un cluster Managed Service per Apache Spark. I componenti possono essere aggiunti ai cluster creati con Managed Service per Apache Spark versione 1.3 e successive.

Per la versione del componente inclusa in ogni release dell'immagine Managed Service per Apache Spark, consulta Versioni di Dataproc supportate.

Comando g-cloud

Per creare un cluster Managed Service per Apache Spark che includa il componente Zeppelin, utilizza il comando gcloud dataproc clusters create cluster-name con il flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

API REST

Il componente Zeppelin può essere specificato tramite l'API Managed Service per Apache Spark utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

  1. Abilita il componente e il gateway dei componenti.
    • Nella Google Cloud console, apri la pagina Crea un cluster di Managed Service per Apache Spark. Il riquadro Configura cluster è selezionato.
    • Nella sezione Componenti:

Aprire il notebook Zeppelin

Consulta Visualizzare e accedere agli URL del gateway dei componenti per fare clic sui link del gateway dei componenti nella Google Cloud console per aprire l'interfaccia utente del notebook Zeppelin in esecuzione sul nodo master del cluster nel browser locale.