Komponen Pig opsional Managed Service untuk Apache Spark

Anda dapat menginstal komponen tambahan seperti Apache Pig saat membuat cluster Managed Service untuk Apache Spark menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Pig, platform open source untuk menganalisis set data besar.

Menginstal komponen

Instal komponen saat Anda membuat cluster Managed Service untuk Apache Spark.

Apache Pig adalah komponen opsional di Managed Service untuk Apache Spark 2.3 dan versi image yang lebih baru.

Lihat Versi Managed Service untuk Apache Spark yang didukung untuk versi komponen yang disertakan dalam rilis gambar Managed Service untuk Apache Spark terbaru.

gcloud

Untuk membuat cluster Managed Service untuk Apache Spark yang menyertakan komponen Pig, gunakan perintah gcloud dataproc clusters create CLUSTER_NAME dengan flag --optional-components (menggunakan versi image 2.3 atau yang lebih baru).

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --optional-components=PIG \
    --image-version=2.3 \
    ... other flags

REST API

Komponen Pig dapat ditentukan melalui Managed Service untuk Apache Spark API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.

Konsol

Aktifkan komponen:

  1. Di konsol Google Cloud , buka halaman Managed Service for Apache Spark Create a cluster. Panel Set up cluster dipilih.
  2. Di bagian Components, di bagian Optional components, pilih Pig dan komponen opsional lainnya untuk diinstal di cluster Anda.