Anda dapat menginstal komponen tambahan seperti Apache Pig saat membuat cluster Managed Service for Apache Spark menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Pig, platform open source untuk menganalisis set data besar.
Menginstal komponen
Instal komponen saat Anda membuat cluster Managed Service for Apache Spark.
Apache Pig adalah komponen opsional di Managed Service untuk Apache Spark 2.3 dan versi image yang lebih baru.
Lihat Versi Managed Service for Apache Spark yang didukung untuk versi komponen yang disertakan dalam rilis image Managed Service for Apache Spark terbaru.
gcloud
Untuk membuat cluster Managed Service for Apache Spark yang menyertakan komponen Pig, gunakan perintah
gcloud dataproc clusters create CLUSTER_NAME
dengan flag --optional-components (menggunakan versi image 2.3 atau yang lebih baru).
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --optional-components=PIG \ --image-version=2.3 \ ... other flags
REST API
Komponen Pig dapat ditentukan melalui Managed Service untuk Apache Spark API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.
Konsol
Aktifkan komponen:
- Di konsol Google Cloud , buka halaman Managed Service for Apache Spark Create a cluster. Panel Set up cluster dipilih.
- Di bagian Components, di bagian Optional components, pilih Pig dan komponen opsional lainnya untuk diinstal di cluster Anda.