Vous pouvez installer des composants supplémentaires, comme Zeppelin, lorsque vous créez un cluster Managed Service for Apache Spark à l'aide de la fonctionnalité Composants facultatifs. Cette page décrit le composant Zeppelin.
Le composant Notebook Zeppelin
est un notebook Web utilisé pour l'analyse interactive de données. L'interface utilisateur Web de Zeppelin est disponible sur le port 8080 du premier nœud maître du cluster.
Par défaut, les notebooks sont enregistrés dans Cloud Storage
dans le bucket de préproduction Managed Service for Apache Spark (spécifié par l'utilisateur ou
créé automatiquement
lors de la création du cluster). L'emplacement peut être modifié au moment de la création du cluster
via la
zeppelin:zeppelin.notebook.gcs.dir propriété.
Installer le composant
Installez le composant lorsque vous créez un cluster Managed Service for Apache Spark. Des composants peuvent être ajoutés aux clusters créés avec Managed Service for Apache Spark version 1.3 et ultérieure.
Consultez la section Versions Dataproc compatibles pour obtenir la version de composant incluse dans chaque version d'image Managed Service for Apache Spark.
Commande gcloud
Pour créer un cluster Managed Service for Apache Spark incluant le composant Zeppelin,
utilisez la
commande gcloud dataproc clusters create cluster-name
avec l'option --optional-components.
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
API REST
Le composant Zeppelin peut être spécifié via l'API Managed Service for Apache Spark à l'aide de SoftwareConfig.Component dans le cadre d'une requête clusters.create.Console
- Activez le composant et la passerelle des composants.
- Dans la Google Cloud console, ouvrez la page Managed Service for Apache Spark Créer un cluster page. Le panneau "Configurer un cluster" est sélectionné.
- Dans la section Composants :
- Sous "Composants facultatifs", sélectionnez "Zeppelin" et les autres composants facultatifs à installer sur votre cluster.
- Sous "Passerelle des composants", sélectionnez "Activer la passerelle des composants" (consultez la section Afficher les URL de la passerelle des composants et y accéder).
Ouvrir le notebook Zeppelin
Consultez la section Afficher les URL de la passerelle des composants et y accéder . Elle contient des liens de la passerelle des composants dans la Google Cloud console, sur lesquels vous pouvez cliquer pour ouvrir l'interface utilisateur du notebook Zeppelin s'exécutant sur le nœud maître du cluster dans votre navigateur local .