Descripción general de Dataproc en GKE
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Dataproc en GKE te permite ejecutar aplicaciones de macrodatos con la
API de jobs Dataproc en clústeres de GKE.
Usa la Google Cloud consola, la CLI de Google Cloud o la API de Dataproc
(solicitud HTTP o bibliotecas cliente de Cloud) para
crear un clúster virtual de Dataproc en GKE,
luego, envía un trabajo de Spark, PySpark, SparkR o Spark-SQL al servicio de Dataproc.
Dataproc en GKE implementa clústeres virtuales de Dataproc en
un clúster de GKE. A diferencia de
los clústeres de Dataproc en Compute Engine,
los clústeres virtuales de Dataproc en GKE no incluyen VMs principales y de trabajador independientes. En cambio, cuando creas un clúster virtual de Dataproc en GKE,
Dataproc en GKE crea grupos de nodos dentro de un clúster de GKE. Los trabajos de Dataproc en GKE
se ejecutan como pods en estos grupos de nodos. GKE administra los grupos de nodos y
la programación de pods en los grupos de nodos.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2026-01-24 (UTC)"],[],[]]