Dataproc 選用 Solr 元件

使用選用元件功能建立 Dataproc 叢集時,可以安裝 Solr 等其他元件。本頁面說明 Solr 元件相關資訊。

Apache Solr 元件是開放原始碼的企業搜尋平台。Solr 伺服器和 Web UI 可透過叢集主要節點的 8983 通訊埠存取。

保存 Solr 檔案:根據預設,Solr 會在 HDFS 中寫入並讀取索引和交易記錄檔。如要保存 Solr 檔案,請在安裝元件時設定 dataproc:solr.gcs.path 叢集屬性,將 Cloud Storage 路徑用作 Solr 主目錄。

安裝元件

請在建立 Dataproc 叢集時安裝元件。若要新增元件,則需使用以 Dataproc 1.3 以上版本所建立的叢集。

請參閱「支援的 Dataproc 版本」,瞭解每個 Dataproc 映像檔版本中包含的元件版本。

gcloud 指令

如要建立包含 Solr 元件的 Dataproc 叢集,請使用 gcloud dataproc clusters create cluster-name 指令並加上 --optional-components 旗標。下列範例指令展示如何以選用的 properties 旗標,將 Cloud Storage 路徑設為 Solr 主目錄。

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
請將 --properties="dataproc:solr.gcs.path=gs://bucket-name/" 叢集屬性新增至 gcloud dataproc clusters create 指令,以設定用於儲存 Solr 文件的 Cloud Storage bucket (Solr 主目錄)。

REST API

您可以透過 Dataproc API 指定 Solr 元件,方法是在 clusters.create 要求使用 SoftwareConfig.Component

控制台

  1. 啟用元件和元件閘道。
    • 在 Google Cloud 控制台,開啟 Dataproc 的「Create a cluster」(建立叢集) 頁面。系統已選取「Set up cluster」(設定叢集) 面板。
    • 在「Components」(元件) 部分執行下列操作:
      • 在「Optional components」(選用元件) 下方,選取叢集所要安裝的 Solr 及其他選用元件。
      • 在「Component Gateway」(元件閘道) 下方,選取「Enable component gateway」(啟用元件閘道) (請參閱「查看及存取元件閘道網址」)。