Managed Service for Apache Spark クラスタを作成する際には、 オプション コンポーネント 機能を使用して、Zeppelin などの追加コンポーネントをインストールできます。このページでは Zeppelin コンポーネントについて説明します。
Zeppelin ノートブック コンポーネントは、インタラクティブなデータ分析を行うためのウェブベースのノートブックです。Zeppelin のウェブ UI は、クラスタの最初のマスターノードのポート 8080 で使用できます。
デフォルトでは、ノートブックは Managed Service for Apache Spark ステージング バケット内の Cloud Storage
に保存されます。保存先バケットは、クラスタの作成時にユーザーが指定するか、指定がなければ
自動作成
されます。この場所は、クラスタの作成時に
zeppelin:zeppelin.notebook.gcs.dir プロパティを使用して変更できます。
コンポーネントをインストールする
Managed Service for Apache Spark クラスタの作成時にコンポーネントをインストールします。 Managed Service for Apache Spark バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。
Managed Service for Apache Spark イメージの各リリースに含まれるコンポーネント バージョンについては、 サポートされる Dataproc バージョン をご覧ください。
gcloud コマンド
Zeppelin コンポーネントを含む Managed Service for Apache Spark クラスタを作成するには、
gcloud dataproc clusters create cluster-name
コマンドを --optional-components フラグとともに使用します。
--enable-component-gateway フラグを指定したgcloud dataproc clusters create コマンドを使用します。
gcloud dataproc clusters create cluster-name \ --optional-components=ZEPPELIN \ --region=region \ --enable-component-gateway \ ... other flags
REST API
Managed Service for Apache Spark API を使用して Zeppelin コンポーネントを指定するには、 SoftwareConfig.Component を clusters.create リクエストの一部として使用します。 を使用して、clusters.create リクエストの一部として EndpointConfig.enableHttpPortAccess プロパティをtrue に設定し、
コンポーネント ゲートウェイを使用する Zeppelin ノートブック ウェブ UI への接続を有効にします。
コンソール
- コンポーネントとコンポーネント ゲートウェイを有効にします。
- コンソールで、Managed Service for Apache Spark の [クラスタの作成] ページを開きます。 Google Cloud [クラスタの設定] パネルが選択されています。
- [コンポーネント] セクションで次の設定を行います。
- [オプション コンポーネント] で、クラスタにインストールする Zeppelin や、他のオプション コンポーネントを選択します。
- [コンポーネント ゲートウェイ] で [コンポーネント ゲートウェイを有効にする] を選択します(コンポーネント ゲートウェイの URL を表示してアクセスするをご覧ください)。
Zeppelin ノートブックを開く
コンポーネント ゲートウェイの URL を表示してアクセスするを参照し、 Google Cloud コンソールでコンポーネント ゲートウェイ リンクをクリックします。これにより、クラスタのマスターノード上で実行されている Zeppelin ノートブックの UI がローカル ブラウザ内に開きます。