Puoi installare componenti aggiuntivi come Zeppelin quando crei un cluster Managed Service for Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Zeppelin.
Il componente Zeppelin Notebook è un notebook basato su web per l'analisi interattiva dei dati. L'interfaccia utente web di Zeppelin è disponibile sulla porta 8080 nel primo nodo master del cluster.
Per impostazione predefinita, i blocchi note vengono salvati in Cloud Storage
nel bucket gestione temporanea Managed Service for Apache Spark, specificato dall'utente o
creato automaticamente
quando viene creato il cluster. La posizione può essere modificata al momento della creazione del cluster tramite la
proprietà zeppelin:zeppelin.notebook.gcs.dir.
Installare il componente
Installa il componente quando crei un cluster Managed Service for Apache Spark. I componenti possono essere aggiunti ai cluster creati con Managed Service for Apache Spark versione 1.3 e successive.
Consulta Versioni di Dataproc supportate per la versione del componente inclusa in ogni release dell'immagine Managed Service for Apache Spark.
Comando g-cloud
Per creare un cluster Managed Service for Apache Spark che includa il componente Zeppelin,
utilizza il comando
gcloud dataproc clusters create cluster-name
con il flag --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
Il componente Zeppelin può essere specificato tramite l'API Managed Service for Apache Spark utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.Console
- Attiva il componente e il gateway dei componenti.
- Nella console Google Cloud , apri la pagina Managed Service for Apache Spark Crea un cluster. Il riquadro Configura cluster è selezionato.
- Nella sezione Componenti:
- Nella sezione Componenti facoltativi, seleziona Zeppelin e altri componenti facoltativi da installare sul cluster.
- In Gateway dei componenti, seleziona Attiva gateway dei componenti (vedi Visualizzare e accedere agli URL del gateway dei componenti).
Apri il notebook Zeppelin
Consulta Visualizzazione e accesso agli URL del gateway dei componenti per fare clic sui link del gateway dei componenti nella console Google Cloud per aprire l'interfaccia utente del notebook Zeppelin in esecuzione sul nodo master del cluster nel browser locale.