Présentation de Managed Service pour Apache Spark sur GKE

Managed Service pour Apache Spark sur GKE vous permet d'exécuter des applications Big Data à l'aide de l'API jobs Managed Service pour Apache Spark sur les clusters GKE. Utilisez la console Google Cloud , la Google Cloud CLI ou l'API Managed Service pour Apache Spark (requête HTTP ou bibliothèques clientes Cloud) pour créer un cluster virtuel Managed Service pour Apache Spark sur GKE, puis envoyez un job Spark, PySpark, SparkR ou Spark-SQL au service Managed Service pour Apache Spark.

Managed Service pour Apache Spark sur GKE est compatible avec les versions 3.5 de Spark.

Fonctionnement de Managed Service pour Apache Spark sur GKE

Managed Service pour Apache Spark sur GKE déploie des clusters virtuels Managed Service pour Apache Spark sur un cluster GKE. Contrairement aux clusters Managed Service pour Apache Spark sur Compute Engine, les clusters virtuels Managed Service pour Apache Spark sur GKE n'incluent pas de VM maîtres ni de VM de nœuds de calcul distinctes. En revanche, lorsque vous créez un cluster virtuel Managed Service pour Apache Spark sur GKE, Managed Service pour Apache Spark sur GKE crée des pools de nœuds dans un cluster GKE. Les jobs Managed Service pour Apache Spark sur GKE sont exécutés en tant que pods sur ces pools de nœuds. Les pools de nœuds et la planification des pods sur les pools de nœuds sont gérés par GKE.