Puoi installare componenti aggiuntivi come Zeppelin quando crei un cluster Managed Service per Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Zeppelin.
Il componente Zeppelin Notebook
è un notebook basato su web per l'analisi interattiva dei dati. L'interfaccia utente web di Zeppelin è disponibile sulla porta 8080 nel primo nodo master del cluster.
Per impostazione predefinita, i notebook vengono salvati in Cloud Storage
nel bucket gestione temporanea Managed Service per Apache Spark, specificato dall'utente o
creato automaticamente
quando viene creato il cluster. La posizione può essere modificata al momento della creazione del cluster
tramite la
zeppelin:zeppelin.notebook.gcs.dir proprietà.
Installare il componente
Installa il componente quando crei un cluster Managed Service per Apache Spark. I componenti possono essere aggiunti ai cluster creati con Managed Service per Apache Spark versione 1.3 e successive.
Per la versione del componente inclusa in ogni release dell'immagine Managed Service per Apache Spark, consulta Versioni di Dataproc supportate.
Comando g-cloud
Per creare un cluster Managed Service per Apache Spark che includa il componente Zeppelin,
utilizza il
comando gcloud dataproc clusters create cluster-name
con il flag --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
Il componente Zeppelin può essere specificato tramite l'API Managed Service per Apache Spark utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.Console
- Abilita il componente e il gateway dei componenti.
- Nella Google Cloud console, apri la pagina Crea un cluster di Managed Service per Apache Spark. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Zeppelin e altri componenti facoltativi da installare sul cluster.
- In Gateway dei componenti, seleziona Attiva gateway dei componenti (vedi Visualizzare e accedere agli URL del gateway dei componenti).
Aprire il notebook Zeppelin
Consulta Visualizzare e accedere agli URL del gateway dei componenti per fare clic sui link del gateway dei componenti nella Google Cloud console per aprire l'interfaccia utente del notebook Zeppelin in esecuzione sul nodo master del cluster nel browser locale.