Managed Service for Apache Spark 選用 Hive WebHCat 元件

使用選用元件功能建立 Managed Service for Apache Spark 叢集時,可以安裝 Hive WebHCat 等其他元件。本頁說明 Hive WebHCat 元件的相關資訊。

Hive WebHCat 元件提供 HCatalog 適用的 REST API。REST 服務可以透過叢集第一個主要節點的通訊埠 50111 存取。

安裝元件

請在建立 Managed Service for Apache Spark 叢集時安裝元件。如要新增元件,則需使用以 Managed Service for Apache Spark 1.3 以上版本所建立的叢集。

請參閱「支援的 Managed Service for Apache Spark 版本」,瞭解每個 Managed Service for Apache Spark 映像檔版本中包含的元件版本。

gcloud 指令

如要建立包含 Hive WebHCat 元件的 Managed Service for Apache Spark 叢集,請使用 gcloud dataproc clusters create cluster-name 指令並加上 --optional-components 旗標。

gcloud dataproc clusters create cluster-name \
    --optional-components=HIVE_WEBHCAT \
    --region=region \
    ... other args

REST API

您可以透過 Managed Service for Apache Spark API,在 clusters.create 要求中納入 SoftwareConfig.Component,以指定 Hive WebHCat 元件。

控制台

  1. 啟用元件。
    • 在 Google Cloud 控制台中,開啟 Managed Service for Apache Spark 的「建立叢集」頁面。系統會選取「Set up cluster」(設定叢集) 面板。
    • 在「Components」(元件) 部分,選取「Optional components」(選用元件) 下方的「Hive WebHCat」,以及要在叢集上安裝的其他選用元件。