Managed Service for Apache Spark のオプションの Zeppelin コンポーネント

Managed Service for Apache Spark クラスタを作成する際には、オプション コンポーネント機能を使用して、Zeppelin などの追加コンポーネントをインストールできます。このページでは Zeppelin コンポーネントについて説明します。

Zeppelin ノートブック コンポーネントは、インタラクティブなデータ分析を行うためのウェブベースのノートブックです。Zeppelin のウェブ UI は、クラスタの最初のマスターノードのポート 8080 で使用できます。

デフォルトでは、ノートブックは Managed Service for Apache Spark ステージング バケット内の Cloud Storage に保存されます。保存先バケットは、クラスタの作成時にユーザーが指定するか、指定がなければ自動作成されます。この場所は、クラスタの作成時に zeppelin:zeppelin.notebook.gcs.dir プロパティを使用して変更できます。

コンポーネントをインストールする

Managed Service for Apache Spark クラスタの作成時にコンポーネントをインストールします。コンポーネントは、Managed Service for Apache Spark バージョン 1.3 以降で作成されたクラスタに追加できます。

Managed Service for Apache Spark イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされている Dataproc バージョンをご覧ください。

gcloud コマンド

Zeppelin コンポーネントを含む Managed Service for Apache Spark クラスタを作成するには、--optional-components フラグを指定して gcloud dataproc clusters create cluster-name コマンドを使用します。

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

REST API

Zeppelin コンポーネントは、clusters.create リクエストの一部として SoftwareConfig.Component を使用して Managed Service for Apache Spark API で指定できます。

コンソール

  1. コンポーネントとコンポーネント ゲートウェイを有効にします。
    • Google Cloud コンソールで、Managed Service for Apache Spark の [クラスタの作成] ページを開きます。[クラスタの設定] パネルが選択されています。
    • [コンポーネント] セクションで次の設定を行います。

Zeppelin ノートブックを開く

コンポーネント ゲートウェイの URL を表示してアクセスするを参照し、 Google Cloud コンソールでコンポーネント ゲートウェイ リンクをクリックします。これにより、クラスタのマスターノード上で実行されている Zeppelin ノートブックの UI がローカル ブラウザ内に開きます。