Anda dapat menginstal komponen tambahan seperti Apache Pig saat membuat cluster Managed Service untuk Apache Spark menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Pig, platform open source untuk menganalisis set data besar.
Menginstal komponen
Instal komponen saat Anda membuat cluster Managed Service untuk Apache Spark.
Apache Pig adalah komponen opsional di Managed Service untuk Apache Spark 2.3 dan versi image yang lebih baru.
Lihat Versi Managed Service untuk Apache Spark yang didukung untuk versi komponen yang disertakan dalam rilis gambar Managed Service untuk Apache Spark terbaru.
gcloud
Untuk membuat cluster Managed Service untuk Apache Spark yang menyertakan komponen Pig, gunakan perintah
gcloud dataproc clusters create CLUSTER_NAME
dengan flag --optional-components (menggunakan versi image 2.3 atau yang lebih baru).
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ --optional-components=PIG \ --image-version=2.3 \ ... other flags
REST API
Komponen Pig dapat ditentukan melalui Managed Service untuk Apache Spark API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.
Konsol
Aktifkan komponen:
- Di konsol Google Cloud , buka halaman Managed Service for Apache Spark Create a cluster. Panel Set up cluster dipilih.
- Di bagian Components, di bagian Optional components, pilih Pig dan komponen opsional lainnya untuk diinstal di cluster Anda.