Puoi installare componenti aggiuntivi come Zeppelin quando crei un cluster Managed Service for Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Zeppelin.
Il componente Zeppelin Notebook
è un notebook basato su web per l'analisi interattiva dei dati. L'interfaccia utente web di Zeppelin è disponibile sulla porta 8080 nel primo nodo master del cluster.
Per impostazione predefinita, i notebook vengono salvati in Cloud Storage
nel bucket gestione temporanea Managed Service for Apache Spark, specificato dall'utente o
creato automaticamente
al momento della creazione del cluster. La posizione può essere modificata al momento della creazione del cluster
tramite la
zeppelin:zeppelin.notebook.gcs.dir proprietà.
Installare il componente
Installa il componente quando crei un cluster Managed Service for Apache Spark. I componenti possono essere aggiunti ai cluster creati con Managed Service for Apache Spark versione 1.3 e successive.
Per la versione del componente inclusa in ogni release dell'immagine Managed Service for Apache Spark, consulta Versioni di Dataproc supportate.
Comando g-cloud
Per creare un cluster Managed Service for Apache Spark che includa il componente Zeppelin,
utilizza il
comando gcloud dataproc clusters create cluster-name
con il flag --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
Il componente Zeppelin può essere specificato tramite l'API Managed Service for Apache Spark utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.Console
- Abilita il componente e il gateway dei componenti.
- Nella Google Cloud console, apri la pagina Crea un cluster di Managed Service for Apache Spark. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- In Componenti facoltativi, seleziona Zeppelin e altri componenti facoltativi da installare sul cluster.
- In Gateway dei componenti, seleziona Attiva gateway dei componenti (vedi Visualizzare e accedere agli URL del gateway dei componenti).
Aprire il notebook Zeppelin
Consulta Visualizzare e accedere agli URL del gateway dei componenti per fare clic sui link del gateway dei componenti nella Google Cloud console e aprire l'interfaccia utente del notebook Zeppelin in esecuzione sul nodo master del cluster nel browser locale.