Componente Solr facoltativo di Managed Service per Apache Spark

Puoi installare componenti aggiuntivi come Solr quando crei un cluster Managed Service for Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Solr.

Il componente Apache Solr è una piattaforma di ricerca aziendale open source. Il server Solr e la UI web sono disponibili sulla porta 8983 sui nodi master del cluster.

Persistenza dei file Solr:per impostazione predefinita, Solr scrive e legge i file di indice e di log delle transazioni in HDFS. Per rendere persistenti i file Solr, utilizza un percorso Cloud Storage come directory home di Solr impostando la dataproc:solr.gcs.path proprietà del cluster quando installi il componente.

Installa il componente

Installa il componente quando crei un cluster Managed Service per Apache Spark. I componenti possono essere aggiunti ai cluster creati con Managed Service per Apache Spark versione 1.3 e successive.

Consulta Versioni supportate di Managed Service per Apache Spark per la versione del componente inclusa in ogni release dell'immagine di Managed Service per Apache Spark.

Comando g-cloud

Per creare un cluster Managed Service per Apache Spark che includa il componente Solr, utilizza il comando gcloud dataproc clusters create cluster-name con il flag --optional-components. Il comando di esempio riportato di seguito utilizza il flag facoltativo properties per impostare un percorso Cloud Storage come directory home di Solr.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
Aggiungi la proprietà del cluster --properties="dataproc:solr.gcs.path=gs://bucket-name/" al comando gcloud dataproc clusters create per impostare un bucket Cloud Storage in cui verranno archiviati i documenti Solr (directory home di Solr).

API REST

Il componente Solr può essere specificato tramite l'API Managed Service per Apache Spark utilizzando SoftwareConfig.Component nell'ambito di una richiesta clusters.create.

Console

  1. Attiva il componente e il gateway dei componenti.
    • Nella console Google Cloud , apri la pagina Managed Service for Apache Spark Crea un cluster. Il riquadro Configura cluster è selezionato.
    • Nella sezione Componenti: