Descripción general de Managed Service para Apache Spark en GKE

Managed Service para Apache Spark en GKE te permite ejecutar aplicaciones de macrodatos con la API de jobsManaged Service para Apache Spark en clústeres de GKE. Usa la Google Cloud consola de, la Google Cloud CLI o la API de Managed Service para Apache Spark (solicitud HTTP o bibliotecas cliente de Cloud) para crear un clúster virtual de Managed Service para Apache Spark en GKE, luego, envía un trabajo de Spark, PySpark, SparkR o Spark-SQL al servicio de Managed Service para Apache Spark.

Managed Service para Apache Spark en GKE admite versiones de Spark 3.5.

Cómo funciona Managed Service para Apache Spark en GKE

Managed Service para Apache Spark en GKE implementa clústeres virtuales de Managed Service para Apache Spark en un clúster de GKE. A diferencia de los clústeres de Managed Service para Apache Spark en Compute Engine, los clústeres virtuales de Managed Service para Apache Spark en GKE no incluyen VMs de trabajador y principal independientes. En cambio, cuando creas un clúster virtual de Managed Service para Apache Spark en GKE, Managed Service para Apache Spark en GKE crea grupos de nodos dentro de un clúster de GKE. Los trabajos de Managed Service para Apache Spark en GKE se ejecutan como pods en estos grupos de nodos. GKE administra los grupos de nodos y la programación de pods en los grupos de nodos.