自动选择地区

创建 Managed Service for Apache Spark 集群时,您需要指定 一个 Compute Engine 区域 作为集群的位置。您还可以指定该区域内的可用区,或者,您可以省略可用区,以让 Managed Service for Apache Spark 自动选择可用区功能在指定区域中为您选择可用区。集群的所有节点都将部署到所选可用区。

如果集群区域包含至少两个未排除的可用区,您可以从自动选择可用区选择条件中排除可用区。如需了解详情,请参阅 使用自动选择可用区展示位置

自动选择可用区和资源预留

自动选择可用区会优先在具有资源预留的可用区中创建集群,如下所示:

  • 如果可用区中的预留资源加上(如有必要)按需资源可以完全满足所请求的集群资源,则自动选择可用区会使用预留资源和按需资源,并在该可用区中创建集群。

  • 自动选择可用区会根据可用区中的总 CPU 核心 (vCPU)预留优先选择可用区。

    示例:集群创建请求指定了 20 个 n2-standard-2 和 1 个 n2-standard-64(请求的 vCPUs 数为 40 + 64)。自动选择可用区会根据可用区中可用的总 vCPU 预留,优先选择以下可用区:

    1. zone-c 可用预留:3 个 n2-standard-2 和 1 个 n2-standard-64(70 个 vCPUs
    2. zone-b 可用预留:1 个 n2-standard-64(64 个 vCPUs
    3. zone-a 可用预留:25 个 n2-standard-2(50 个 vCPUs

      假设上述每个可用区都有额外的按需 vCPU 和其他资源,足以满足集群请求,自动选择可用区会选择 zone-c 来创建集群。

  • 如果可用区中的预留资源加上按需资源无法完全满足所请求的集群资源,则自动选择可用区会在最有可能使用按需资源满足请求的可用区中创建集群。

使用自动选择可用区展示位置

控制台

如需创建使用自动选择可用区展示位置的 Managed Service for Apache Spark 集群,请执行以下操作:

  1. 在 Google Cloud 控制台中,打开 Managed Service for Apache Spark 在 Compute Engine 上创建 Managed Service for Apache Spark 集群 页面。设置集群 面板已处于选中状态。
  2. 位置部分中,执行以下操作:
    • 为集群选择一个区域
    • 可用区 下,选择“任意”。

排除可用区 :控制台不支持指定要从自动选择可用区展示位置中排除的可用区。 Google Cloud 您可以使用 Google Cloud CLI 和 REST API 来使用此功能。

gcloud CLI

如需创建使用自动选择可用区展示位置的 Managed Service for Apache Spark 集群,请使用 gcloud dataproc clusters create 命令。将 --region 标志设置为某个区域,然后 忽略 --zone 标志或将 --zone 标志设置为空字符串 (--zone="")。

除了使用 `--zone` 标志之外,您还可以使用 --auto-zone-exclude-zones 标志来指定可用区的英文逗号分隔列表 。自动选择可用区功能会从指定区域中选择一个可用区,但会从其选择条件中排除列出的可用区。请注意,集群区域中必须至少有两个未排除的可用区。

示例

自动选择可用区基本用法:

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    other args ...

自动选择可用区(排除可用区):

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --auto-zone-exclude-zones=ZONE_1,ZONE_2 \
    other args ...

REST API

如需创建使用自动选择可用区展示位置的 Managed Service for Apache Spark 集群, 请构建 JSON clusters.create API 请求,并将 gceClusterConfig.zoneUri 字段留空。在 REST 端点 https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters 中,插入区域名称。Managed Service for Apache Spark 自动选择可用区功能会在指定区域内为集群选择一个可用区。

如需排除特定可用区,您可以向 gceClusterConfig.autoZoneExcludeZoneUris 字段填充要排除的可用区名称列表。 请注意,集群区域中必须至少有两个未排除的可用区。

在自动选择可用区功能中使用短资源名称:在自动选择可用区功能 REST API 集群创建请求中指定资源 URI(例如 machineTypeUriacceleratorTypeUri)时, 请使用不带可用区规范的短资源名称,例如 “n1-standard-2”或“nvidia-tesla-t4”。