Componente Pig facoltativo di Managed Service per Apache Spark

Puoi installare componenti aggiuntivi come Apache Pig quando crei un cluster Managed Service per Apache Spark utilizzando la funzionalità Componenti facoltativi. Questa pagina descrive il componente Pig, una piattaforma open source per l'analisi di set di dati di grandi dimensioni.

Installare il componente

Installa il componente quando crei un cluster Managed Service per Apache Spark.

Apache Pig è un componente facoltativo nelle versioni dell'immagine 2.3 e successive di Managed Service per Apache Spark.

Per le versioni dei componenti incluse nelle ultime release delle immagini di Managed Service per Apache Spark, consulta Versioni di Managed Service per Apache Spark supportate.

gcloud

Per creare un cluster Managed Service per Apache Spark che includa il componente Pig, utilizza il gcloud dataproc clusters create CLUSTER_NAME comando con il flag --optional-components (utilizzando la versione dell'immagine 2.3 o successive).

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --optional-components=PIG \
    --image-version=2.3 \
    ... other flags

API REST

Il componente Pig può essere specificato tramite l'API Managed Service per Apache Spark utilizzando SoftwareConfig.Component come parte di una clusters.create.

Console

Attiva il componente:

  1. Nella Google Cloud console, apri la pagina Crea un cluster di Managed Service per Apache Spark. Il riquadro Configura cluster è selezionato.
  2. Nella sezione Componenti, in Componenti facoltativi, seleziona Pig e altri componenti facoltativi da installare sul cluster.