"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Crea node pool

Quando crei o aggiorni un cluster virtuale Managed Service for Apache Spark su GKE, specifichi uno o più pool di nodi che il cluster virtuale utilizzerà per eseguire i job (questo cluster è denominato cluster "utilizzato da" o "associato" ai pool di nodi specificati). Se un pool di nodi specificato non esiste nel tuo cluster GKE, Managed Service for Apache Spark su GKE creerà il pool di nodi nel cluster GKE con le impostazioni che specifichi. Se il pool di nodi esiste ed è stato creato da Managed Service for Apache Spark, verrà convalidato per verificare che le sue impostazioni corrispondano a quelle specificate.

Impostazioni del pool di nodi di Managed Service for Apache Spark su GKE

Puoi specificare le seguenti impostazioni nei pool di nodi utilizzati dai cluster virtuali Managed Service for Apache Spark su GKE (queste impostazioni sono un sottoinsieme delle impostazioni del pool di nodi GKE):

accelerators
acceleratorCount
acceleratorType
gpuPartitionSize*
localSsdCount
machineType
minCpuPlatform
minNodeCount
maxNodeCount
preemptible
spot*

Note:

gpuPartitionSize può essere impostato nell'API Managed Service for Apache Spark GkeNodePoolAcceleratorConfig.
spot può essere impostato in GkeNodeConfig dell'API Managed Service for Apache Spark.

Eliminazione del node pool

Quando viene eliminato un cluster Managed Service for Apache Spark su GKE, i pool di nodi utilizzati dal cluster non vengono eliminati. Consulta Eliminare un pool di nodi per eliminare i pool di nodi non più utilizzati dai cluster Managed Service for Apache Spark su GKE.

Località del node pool

Puoi specificare la posizione della zona dei pool di nodi associati al tuo cluster virtuale Managed Service for Apache Spark su GKE quando crei o aggiorni il cluster virtuale. Le zone del pool di nodi devono trovarsi nella regione del cluster virtuale associato.

Mappatura dei ruoli ai pool di nodi

I ruoli del node pool sono definiti per il lavoro del driver e dell'executor Spark, con un ruolo predefinito definito per tutti i tipi di lavoro da upool di nodiol. I cluster Managed Service for Apache Spark su GKE devono avere almeno pool di nodiool a cui è assegnato il ruolo default. L'assegnazione di altri ruoli è facoltativa.

Consiglio:crea pool di nodi separati per ogni tipo di ruolo, con tipo e dimensioni dei nodi in base ai requisiti del ruolo.

Esempio di creazione di un cluster virtuale gcloud CLI:

gcloud dataproc clusters gke create "${DP_CLUSTER}" \
  --region=${REGION} \
  --gke-cluster=${GKE_CLUSTER} \
  --spark-engine-version=latest \
  --staging-bucket=${BUCKET} \
  --pools="name=${DP_POOLNAME},roles=default \
  --setup-workload-identity
  --pools="name=${DP_CTRL_POOLNAME},roles=default,machineType=e2-standard-4" \
  --pools="name=${DP_DRIVER_POOLNAME},min=1,max=3,roles=spark-driver,machineType=n2-standard-4" \
  --pools="name=${DP_EXEC_POOLNAME},min=1,max=10,roles=spark-executor,machineType=n2-standard-8"

Crea node pool Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Impostazioni del pool di nodi di Managed Service for Apache Spark su GKE

Eliminazione del node pool

Località del node pool

Mappatura dei ruoli ai pool di nodi

Crea node pool