Optionale Solr-Komponente für Managed Service for Apache Spark

Sie können zusätzliche Komponenten wie Solr installieren, wenn Sie einen Managed Service for Apache Spark Cluster mit dem Feature Optionale Komponenten erstellen. Auf dieser Seite wird die Solr-Komponente erläutert.

Die Apache Solr-Komponente ist eine Open-Source-Plattform für die Unternehmenssuche. Der Solr-Server und die Web-UI sind an Port 8983 auf den Masterknoten des Clusters verfügbar.

Solr-Dateien dauerhaft speichern: Standardmäßig schreibt und liest Solr die Index- und Transaktionslogdateien in HDFS. Um Solr-Dateien dauerhaft zu speichern, verwenden Sie einen Cloud Storage-Pfad als Solr-Basisverzeichnis. Dazu legen Sie bei der Installation der Komponente das Clusterattribut dataproc:solr.gcs.path fest.

Komponente installieren

Installieren Sie die Komponente, wenn Sie einen Managed Service for Apache Spark-Cluster erstellen. Sie können Komponenten in Cluster einfügen, die mit Managed Service for Apache Spark Version 1.3 oder höher erstellt wurden.

Informationen zu den Komponentenversionen, die im jeweiligen Managed Service for Apache Spark-Image-Release enthalten sind, finden Sie im Abschnitt Unterstützte Managed Service for Apache Spark-Versionen.

gcloud-Befehl

Verwenden Sie zum Erstellen eines Managed Service for Apache Spark-Clusters, der die Solr-Komponente enthält, den gcloud dataproc clusters create cluster-name Befehl mit dem --optional-components Flag. Der Beispielbefehl unten verwendet das optionale Flag properties, um einen Cloud Storage-Pfad als Solr-Basisverzeichnis festzulegen.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Fügen Sie dem --properties="dataproc:solr.gcs.path=gs://bucket-name/" Clusterattribut zu dem gcloud dataproc clusters create Befehl hinzu, um einen Cloud Storage-Bucket festzulegen, in dem Solr-Dokumente gespeichert werden (Solr-Basisverzeichnis).

REST API

Die Solr-Komponente kann über die Managed Service for Apache Spark API mit SoftwareConfig.Component als Teil einer clusters.create Anfrage angegeben werden.

Console

  1. Aktivieren Sie die Komponente und das Komponentengateway.
    • Öffnen Sie in der Google Cloud Console die Seite Managed Service for Apache Spark Cluster erstellen. Der Bereich „Cluster einrichten“ ist ausgewählt.
    • Im Bereich „Komponenten“:
      • Wählen Sie unter „Optionale Komponenten“ Solr und andere optionale Komponenten aus, die auf Ihrem Cluster installiert werden sollen.
      • Wählen Sie unter Component Gateway „Component Gateway aktivieren“ aus (siehe Component Gateway-URLs ansehen und aufrufen).