Wenn Sie einen Managed Service for Apache Spark Cluster mit der Funktion für optionale Komponenten erstellen, können Sie zusätzliche Komponenten wie Hive WebHCat installieren. Auf dieser Seite wird die Hive WebHCat-Komponente erläutert.
Die Hive WebHCat
Komponente stellt eine REST API für HCatalog zur Verfügung. Der REST-Dienst ist über Port 50111 im ersten Masterknoten des Clusters verfügbar.
Komponente installieren
Installieren Sie die Komponente, wenn Sie einen Managed Service for Apache Spark-Cluster erstellen. Sie können Komponenten in Cluster einfügen, die mit Managed Service for Apache Spark Version 1.3 oder höher erstellt wurden.
Informationen zu den Komponentenversionen, die im jeweiligen Managed Service for Apache Spark-Image-Release enthalten sind, finden Sie im Abschnitt Unterstützte Managed Service for Apache Spark-Versionen.
gcloud-Befehl
Verwenden Sie zum Erstellen eines Managed Service for Apache Spark-Clusters, der die Hive WebHCat-Komponente enthält,
verwenden Sie den
gcloud dataproc clusters create cluster-name
Befehl mit dem --optional-components Flag.
gcloud dataproc clusters create cluster-name \ --optional-components=HIVE_WEBHCAT \ --region=region \ ... other args
REST API
Die Hive WebHCat-Komponente kann über die Managed Service for Apache Spark API mit SoftwareConfig.Component als Teil einer clusters.create -Anfrage angegeben werden.Console
- Aktivieren Sie die Komponente.
- Öffnen Sie in der Google Cloud console die Seite „Cluster erstellen“ für Managed Service for Apache Spark. Der Bereich „Cluster einrichten“ ist ausgewählt.
- Wählen Sie im Abschnitt „Komponenten“ unter „Optionale Komponenten“ die Option „Hive WebHCat“ und andere optionale Komponenten aus, die im Cluster installiert werden sollen.