Componente Pig facoltativo di Managed Service per Apache Spark

Puoi installare componenti aggiuntivi come Apache Pig quando crei un cluster Managed Service for Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Pig, una piattaforma open source per l'analisi di grandi set di dati.

Installare il componente

Installa il componente quando crei un cluster Managed Service for Apache Spark.

Apache Pig è un componente facoltativo nelle versioni dell'immagine 2.3 e successive di Managed Service for Apache Spark.

Consulta Versioni di Managed Service for Apache Spark supportate per le versioni dei componenti incluse nelle ultime release dell'immagine Managed Service for Apache Spark.

gcloud

Per creare un cluster Managed Service for Apache Spark che includa il componente Pig, utilizza il comando gcloud dataproc clusters create CLUSTER_NAME con il flag --optional-components (utilizzando la versione dell'immagine 2.3 o successive).

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --optional-components=PIG \
    --image-version=2.3 \
    ... other flags

API REST

Il componente Pig può essere specificato tramite l'API Managed Service for Apache Spark utilizzando SoftwareConfig.Component come parte di una richiesta clusters.create.

Console

Attiva il componente:

  1. Nella console Google Cloud , apri la pagina Managed Service for Apache Spark Crea un cluster. Il riquadro Configura cluster è selezionato.
  2. Nella sezione Componenti, in Componenti facoltativi, seleziona Pig e altri componenti facoltativi da installare sul cluster.