Componente Solr facoltativo di Managed Service per Apache Spark

Puoi installare componenti aggiuntivi come Solr quando crei un cluster Managed Service for Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Solr.

Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e la UI web sono disponibili sulla porta 8983 sui nodi master del cluster.

Persistenza dei file Solr: per impostazione predefinita, Solr scrive e legge i file di indice e di log delle transazioni in HDFS. Per rendere persistenti i file Solr, utilizza un percorso Cloud Storage come directory home di Solr impostando la dataproc:solr.gcs.path proprietà del cluster quando installi il componente.

Installare il componente

Installa il componente quando crei un cluster Managed Service for Apache Spark. I componenti possono essere aggiunti ai cluster creati con Managed Service for Apache Spark versione 1.3 e successive.

Consulta Versioni di Managed Service for Apache Spark supportate per la versione del componente inclusa in ogni release dell'immagine di Managed Service for Apache Spark.

Comando g-cloud

Per creare un cluster Managed Service for Apache Spark che includa il componente Solr, utilizza il comando gcloud dataproc clusters create cluster-name con il flag --optional-components. Il comando di esempio riportato di seguito utilizza il flag facoltativo properties per impostare un percorso Cloud Storage come directory home di Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Aggiungi la proprietà del cluster --properties="dataproc:solr.gcs.path=gs://bucket-name/" al comando gcloud dataproc clusters create per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr (directory home di Solr).

API REST

Il componente Solr può essere specificato tramite l'API Managed Service for Apache Spark utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

  1. Attiva il componente e il gateway dei componenti.
    • Nella console Google Cloud , apri la pagina Managed Service for Apache Spark Crea un cluster. Il riquadro Configura cluster è selezionato.
    • Nella sezione Componenti: