Puedes instalar componentes adicionales, como Zeppelin, cuando creas un clúster de Managed Service for Apache Spark con la función de componentes opcionales. En esta página, se describe el componente Zeppelin.
El componente de notebook de Zeppelin
es un notebook basado en la Web para el análisis de datos interactivos. La IU web de Zeppelin está disponible en el puerto 8080 del primer nodo principal del clúster.
De forma predeterminada, los notebook se guardan en Cloud Storage
en el bucket de etapa de pruebas de Managed Service for Apache Spark, que el usuario especifica o
se crea de forma automática
junto con el clúster. La ubicación se puede cambiar en el momento de la creación del clúster
a través de la
zeppelin:zeppelin.notebook.gcs.dir propiedad.
Instala el componente
Instala el componente cuando crees un clúster de Managed Service for Apache Spark. Los componentes se pueden agregar a los clústeres creados con Managed Service for Apache Spark versión 1.3 y posteriores.
Comando de gcloud
Para crear un clúster de Managed Service for Apache Spark que incluya el componente de Zeppelin,
usa el
comando gcloud dataproc clusters create cluster-name
con la marca --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API de REST
El componente Zeppelin se puede especificar a través de la API de Managed Service for Apache Spark mediante SoftwareConfig.Component como parte de una solicitud clusters.create.Console
- Habilita la puerta de enlace del componente y el componente.
- En la Google Cloud consola, abre la página Create a cluster (Crear un clúster) de Managed Service for Apache Spark. Se selecciona el panel Configurar clúster.
- En la sección Componentes, sigue estos pasos:
- En componentes opcionales, selecciona Zeppelin y otros componentes opcionales para instalar en tu clúster.
- En Puerta de enlace de componentes, selecciona Habilitar puerta de enlace de componentes (consulta Visualiza y accede a las URL de la puerta de enlace de componentes).
Abre el notebook de Zeppelin
Consulta Visualiza y accede a las URL de la puerta de enlace de componentes para hacer clic en los vínculos de la puerta de enlace de componentes en la Google Cloud consola para abrir la IU del notebook de Zeppelin que se ejecuta en el nodo principal del clúster en tu navegador local.