Managed Service for Apache Spark クラスタを作成する際には、オプション コンポーネント機能を使用して、Hive WebHCat などの追加コンポーネントをインストールできます。このページでは Hive WebHCat コンポーネントについて説明します。
Hive WebHCat コンポーネントには、HCatalog 用の REST API が用意されています。この REST サービスは、クラスタの最初のマスターノードのポート 50111 で使用できます。
コンポーネントをインストールする
Managed Service for Apache Spark クラスタの作成時にコンポーネントをインストールします。コンポーネントは、Managed Service for Apache Spark バージョン 1.3 以降で作成されたクラスタに追加できます。
Managed Service for Apache Spark イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされている Managed Service for Apache Spark バージョンをご覧ください。
gcloud コマンド
Hive WebHCat コンポーネントを含む Managed Service for Apache Spark クラスタを作成するには、--optional-components フラグを指定して gcloud dataproc clusters create cluster-name コマンドを使用します。
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
REST API
Managed Service for Apache Spark API を使用して Hive WebHCat コンポーネントを指定するには、clusters.create リクエストの一部として SoftwareConfig.Component を使用します。コンソール
- コンポーネントを有効にします。
- Google Cloud コンソールで、Managed Service for Apache Spark の [クラスタの作成] ページを開きます。[クラスタの設定] パネルが選択されています。
- [コンポーネント] セクションの [オプション コンポーネント] で、クラスタにインストールする Hive WebHCat とその他のオプション コンポーネントを選択します。