"Servicio administrado para Apache Spark" es el nuevo nombre del producto que antes se conocía como "Dataproc en Compute Engine" (implementación de clústeres) y "Google Cloud Serverless for Apache Spark" (implementación sin servidores).

Ubicación de zona automática

Cuando creas un clúster de Managed Service for Apache Spark, especificas una región de Compute Engine como la ubicación del clúster. También puedes especificar una zona dentro de esa región o puedes omitir la zona para que la característica de zona automática de Managed Service for Apache Spark seleccione una zona en la región especificada. Todos los nodos del clúster se implementan en la zona seleccionada.

Puedes excluir zonas de los criterios de selección de zona automática si la región del clúster incluye al menos dos zonas no excluidas. Para obtener más información, consulta Usa la posición de zona automática.

Zona automática y reservas de recursos

La zona automática prioriza la creación de un clúster en una zona con reservas de recursos, de la siguiente manera:

Si los recursos del clúster solicitados se pueden satisfacer por completo con los recursos reservados y, si es necesario, con los recursos a pedido en una zona, la zona automática consumirá los recursos reservados y a pedido, y creará el clúster en esa zona.
La zona automática prioriza las zonas para la selección según las reservas totales de núcleos de CPU (vCPU) en una zona.

Ejemplo: Una solicitud de creación de clúster especifica 20 n2-standard-2 y 1 n2-standard-64 (40 + 64 vCPUs solicitadas). La zona automática priorizará las siguientes zonas para la selección según las reservas totales de vCPU disponibles en la zona:
1. Reservas disponibles de zone-c: 3 n2-standard-2 y 1 n2-standard-64 (70 vCPUs)
2. Reservas disponibles de zone-b: 1 n2-standard-64 (64 vCPUs)
3. Reservas disponibles de zone-a: 25 n2-standard-2 (50 vCPUs)
  
  Si se supone que cada una de estas zonas tiene vCPU adicionales a pedido y otros recursos suficientes para satisfacer la solicitud del clúster, la zona automática seleccionará zone-c para la creación del clúster.
Si los recursos del clúster solicitados no se pueden satisfacer por completo con los recursos reservados y a pedido en una zona, la zona automática creará el clúster en una zona que tenga más probabilidades de satisfacer la solicitud con recursos a pedido.

Usa la posición de zona automática

Console

Para crear un clúster de Managed Service for Apache Spark que use la posición de zona automática, haz lo siguiente:

En la Google Cloud consola, abre la página de Managed Service for Apache Spark Crea un clúster de Managed Service for Apache Spark en Compute Engine. Se selecciona el panel Configurar clúster.
En la sección Ubicación, haz lo siguiente:
- Selecciona una Región para tu clúster.
- En Zona, selecciona "Cualquiera".

Excluir zonas: No se admite la especificación de zonas para excluir de la posición de zona automática a través de la Google Cloud consola. Esta función está disponible con Google Cloud CLI y la API de REST.

gcloud CLI

Para crear un clúster de Managed Service for Apache Spark que use la posición de zona automática, utiliza el gcloud dataproc clusters create comando. Establece la marca --region en una región. Luego, omite la marca --zone o establece la marca --zone en una cadena vacía (--zone="").

Como alternativa al uso de la marca `--zone`, puedes usar la marca --auto-zone-exclude-zones para especificar una lista de zonas separadas por comas. La selección de zona automática seleccionará una zona de la región especificada, pero excluirá las zonas enumeradas de sus criterios de selección. Ten en cuenta que debe haber al menos dos zonas no excluidas disponibles en la región del clúster.

Nota: Si estableces una zona predeterminada con el comando gcloud config set compute/zone, debes usar la marca --zone="" o --auto-zone-exclude-zones para habilitar la función de zona automática. Los usuarios de Power Shell deben rodear las comillas vacías con comillas simples: --zone='""'.

Ejemplos:

Uso básico de la zona automática:

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    other args ...

Zona automática con zonas excluidas:

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --auto-zone-exclude-zones=ZONE_1,ZONE_2 \
    other args ...

API de REST

Para crear un clúster de Managed Service for Apache Spark que use la posición de zona automática, construye una solicitud JSON clusters.create a la API y deja el gceClusterConfig.zoneUri campo vacío. En el extremo de REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, inserta un nombre de región. La zona automática de Managed Service for Apache Spark seleccionará una zona para el clúster dentro de la región especificada.

Para excluir zonas específicas, puedes propagar el gceClusterConfig.autoZoneExcludeZoneUris campo con una lista de nombres de zonas para excluir. Ten en cuenta que debe haber al menos dos zonas no excluidas disponibles en la región del clúster.

Usa nombres de recursos cortos con la posición de zona automática: Cuando especifiques un URI de recursos, como machineTypeUri o acceleratorTypeUri, en una solicitud de creación de clúster a la API de REST de posición de zona automática, usa un nombre de recurso corto sin una especificación de la zona, por ejemplo, "n1-standard-2" o "nvidia-tesla-t4".

Ubicación de zona automática Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Zona automática y reservas de recursos

Usa la posición de zona automática

Console

gcloud CLI

API de REST

Ubicación de zona automática