"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Descripción general de Managed Service para Apache Spark en GKE

Managed Service para Apache Spark en GKE te permite ejecutar aplicaciones de macrodatos con la API de jobsManaged Service para Apache Spark en clústeres de GKE. Usa la Google Cloud consola de, la Google Cloud CLI o la API de Managed Service para Apache Spark (solicitud HTTP o bibliotecas cliente de Cloud) para crear un clúster virtual de Managed Service para Apache Spark en GKE, luego, envía un trabajo de Spark, PySpark, SparkR o Spark-SQL al servicio de Managed Service para Apache Spark.

Managed Service para Apache Spark en GKE admite versiones de Spark 3.5.

Cómo funciona Managed Service para Apache Spark en GKE

Managed Service para Apache Spark en GKE implementa clústeres virtuales de Managed Service para Apache Spark en un clúster de GKE. A diferencia de los clústeres de Managed Service para Apache Spark en Compute Engine, los clústeres virtuales de Managed Service para Apache Spark en GKE no incluyen VMs de trabajador y principal independientes. En cambio, cuando creas un clúster virtual de Managed Service para Apache Spark en GKE, Managed Service para Apache Spark en GKE crea grupos de nodos dentro de un clúster de GKE. Los trabajos de Managed Service para Apache Spark en GKE se ejecutan como pods en estos grupos de nodos. GKE administra los grupos de nodos y la programación de pods en los grupos de nodos.

Descripción general de Managed Service para Apache Spark en GKE Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Cómo funciona Managed Service para Apache Spark en GKE

Descripción general de Managed Service para Apache Spark en GKE