Apache Spark용 관리형 서비스 선택적 Pig 구성요소

선택적 구성요소 기능을 사용하여 Managed Service for Apache Spark 클러스터를 만들 때 Apache Pig와 같은 추가 구성요소를 설치할 수 있습니다. 이 페이지에서는 대규모 데이터 세트를 분석하기 위한 오픈소스 플랫폼인 Pig 구성요소를 설명합니다.

구성요소 설치

Managed Service for Apache Spark 클러스터를 만들 때 구성요소를 설치합니다.

Apache Pig는 Managed Service for Apache Spark 2.3 이상 이미지 버전의 선택적 구성요소입니다.

최신 Managed Service for Apache Spark 이미지 출시 버전에 포함된 구성요소 버전은 지원되는 Managed Service for Apache Spark 버전을 참조하세요.

gcloud

Pig 구성요소가 포함된 Managed Service for Apache Spark 클러스터를 만들려면 gcloud dataproc clusters create CLUSTER_NAME 명령어를 --optional-components 플래그와 함께 사용합니다 (이미지 버전 2.3 이상 사용).

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --optional-components=PIG \
    --image-version=2.3 \
    ... other flags

REST API

clusters.create

콘솔

구성요소를 사용 설정합니다.

  1. 콘솔에서 Managed Service for Apache Spark 클러스터 만들기 페이지를 엽니다. Google Cloud '클러스터 설정' 패널이 선택되어 있습니다.
  2. 구성요소 섹션의 선택적 구성요소 아래에서 클러스터에 설치할 Pig 및 기타 선택적 구성요소를 선택합니다.