Panoramica di Managed Service per Apache Spark su GKE

Managed Service for Apache Spark su GKE ti consente di eseguire applicazioni Big Data utilizzando l' API di Managed Service for Apache Spark jobssui cluster GKE. Utilizza la Google Cloud console, Google Cloud CLI o l'API Managed Service for Apache Spark (richiesta HTTP o Cloud Client Libraries) per creare un cluster virtuale Managed Service for Apache Spark su GKE, quindi invia un job Spark, PySpark, SparkR o Spark-SQL al servizio Managed Service for Apache Spark.

Managed Service for Apache Spark su GKE supporta le versioni di Spark 3.5.

Come funziona Managed Service for Apache Spark su GKE

Managed Service for Apache Spark su GKE esegue il deployment di cluster virtuali Managed Service for Apache Spark su un cluster GKE. A differenza dei cluster Managed Service for Apache Spark su Compute Engine, i cluster virtuali Managed Service for Apache Spark su GKE non includono VM master e worker separate. Quando crei un cluster virtuale Managed Service for Apache Spark su GKE, Managed Service for Apache Spark su GKE crea invece pool di nodi all'interno di un cluster GKE. I job Managed Service for Apache Spark su GKE vengono eseguiti come pod su questi pool di nodi. I pool di nodi e la pianificazione dei pod sui pool di nodi sono gestiti da GKE.