"Managed Service for Apache Spark" is the new name for the product formerly known as "Dataproc on Compute Engine" (cluster deployment) and "Google Cloud Serverless for Apache Spark" (serverless deployment).
Google uses AI technology to translate content into your preferred language. AI translations can contain errors.
GKE 上的 Managed Service for Apache Spark 概览
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
借助 Managed Service for Apache Spark on GKE,您可以使用 Managed Service for Apache Spark jobs API 在 GKE 集群上执行大数据应用。使用 Google Cloud 控制台、Google Cloud CLI 或 Managed Service for Apache Spark API(HTTP 请求或 Cloud 客户端库)创建 Managed Service for Apache Spark on GKE 虚拟集群,然后将 Spark、PySpark、SparkR 或 Spark-SQL 作业提交到 Managed Service for Apache Spark 服务。
GKE 上的 Managed Service for Apache Spark 支持 Spark 3.5 版。
GKE 上的 Managed Service for Apache Spark 的运作方式
GKE 上的 Managed Service for Apache Spark 会在 GKE 集群上部署 Managed Service for Apache Spark 虚拟集群。与 Compute Engine 集群上的 Managed Service for Apache Spark 不同,GKE 上的 Managed Service for Apache Spark 虚拟集群不包含单独的主虚拟机和工作虚拟机。相反,当您在 GKE 上创建 Managed Service for Apache Spark 虚拟集群时,GKE 上的 Managed Service for Apache Spark 会在 GKE 集群内创建节点池。GKE 上的 Managed Service for Apache Spark 作业会作为这些节点池上的 pod 运行。节点池和节点池上 pod 的调度由 GKE 管理。