Managed Service for Apache Spark のオプションの Solr コンポーネント

Managed Service for Apache Spark クラスタを作成する際には、 オプション コンポーネント 機能を使用して、Solr などの追加コンポーネントをインストールできます。このページでは、Solr コンポーネントについて説明します。

Apache Solr コンポーネントは、オープンソースのエンタープライズ検索プラットフォームです。Solr サーバーとウェブ UI は、クラスタのマスターノードのポート 8983 で使用できます。

Solr ファイルを永続化する: デフォルトでは、Solr は HDFS にあるインデックスとトランザクションのログファイルの書き込みと読み取りを行います。Solr ファイルを永続化するには、コンポーネントをインストールする際に dataproc:solr.gcs.path クラスタ プロパティを設定して Cloud Storage パスを Solr のホーム ディレクトリとして使用します。

コンポーネントをインストールする

Managed Service for Apache Spark クラスタの作成時にコンポーネントをインストールします。 Managed Service for Apache Spark バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。

Managed Service for Apache Spark イメージの各リリースに含まれるコンポーネント バージョンについては、 サポートされている Managed Service for Apache Spark バージョン をご覧ください。

gcloud コマンド

Solr コンポーネントを含む Managed Service for Apache Spark クラスタを作成するには、 gcloud dataproc clusters create cluster-name コマンドと --optional-components フラグを使用します。次のサンプル コマンドでは、オプションの properties フラグを使用して、Cloud Storage のパスを Solr ホーム ディレクトリとして設定します。

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/" クラスタ プロパティgcloud dataproc clusters create コマンドに追加して、Solr ドキュメントが保存される場所(Solr のホーム ディレクトリ)に、Cloud Storage バケットを設定します。

REST API

Solr コンポーネントは、 SoftwareConfig.Component を使用して Managed Service for Apache Spark API で、 clusters.create リクエストの一部として指定できます。

Console

  1. コンポーネントとコンポーネント ゲートウェイを有効にします。
    • コンソールで、Managed Service for Apache Spark の [クラスタの作成] ページを開きます。 Google Cloud [クラスタの設定] パネルが選択されています。
    • [
        コンポーネント] セクションで次の設定を行います。
      • [オプション コンポーネント] で、クラスタにインストールする Solr や、他のオプション コンポーネントを選択します。
      • [コンポーネント ゲートウェイ] で [コンポーネント ゲートウェイを有効にする] を選択します(コンポーネント ゲートウェイの URL を表示してアクセスするをご覧ください)。