Ubicación de zona automática de Dataproc

Cuando creas un clúster de Dataproc, especificas una región de Compute Engine como la ubicación del clúster. También puedes especificar una zona dentro de esa región o puedes omitir la zona para que la función Zona automática de Dataproc seleccione una zona por ti en la región especificada. Todos los nodos del clúster se implementan en la zona seleccionada.

Puedes excluir zonas de los criterios de selección de la zona automática si la región del clúster incluye al menos dos zonas no excluidas. Para obtener más información, consulta Usa la colocación automática de zonas.

Reservas de zonas y recursos automáticas

La función Zona automática prioriza la creación de un clúster en una zona con reservas de recursos, de la siguiente manera:

  • Si los recursos del clúster solicitados se pueden satisfacer por completo con los recursos reservados y, si es necesario, con los recursos bajo demanda en una zona, Zona automática consumirá los recursos reservados y bajo demanda, y creará el clúster en esa zona.

  • La zona automática prioriza las zonas para la selección según las reservas totales de núcleos de CPU (vCPU) en una zona.

    Ejemplo: Una solicitud de creación de clúster especifica 20 n2-standard-2 y 1 n2-standard-64 (se solicitan 40 + 64 vCPUs). La zona automática priorizará las siguientes zonas para la selección según las reservas totales de CPU virtuales disponibles en la zona:

    1. Reservas disponibles en zone-c: 3 n2-standard-2 y 1 n2-standard-64 (70 vCPUs)
    2. zone-b reservas disponibles: 1 n2-standard-64 (64 vCPUs)
    3. zone-a reservas disponibles: 25 n2-standard-2 (50 vCPUs)

      Si se supone que cada una de estas zonas tiene recursos adicionales vCPU y otros recursos a pedido suficientes para satisfacer la solicitud del clúster, la función de zona automática seleccionará zone-c para la creación del clúster.

  • Si los recursos del clúster solicitados no se pueden satisfacer por completo con los recursos reservados más los recursos a pedido en una zona, Zona automática creará el clúster en una zona que probablemente satisfaga la solicitud con recursos a pedido.

Usa la ubicación de zona automática

Console

Para crear un clúster de Dataproc que use la posición de zona automática, haz lo siguiente:

  1. En la Google Cloud consola, abre la página Crea un clúster de Dataproc en Compute Engine. Se selecciona el panel Configurar clúster.
  2. En la sección Ubicación, haz lo siguiente:
    • Selecciona una región para tu clúster.
    • En Zona, selecciona "Cualquiera".

Excluir zonas: No se admite la especificación de zonas para excluir de la ubicación de zona automática a través de la Google Cloud consola. Esta función está disponible a través de Google Cloud CLI y la API de REST.

gcloud CLI

Para crear un clúster de Dataproc que use la ubicación de zona automática, utiliza el comando gcloud dataproc clusters create. Establece la marca --region en una región y, luego, omite la marca --zone o establécela en una cadena vacía (--zone="").--zone

Como alternativa al uso de la marca `--zone`, puedes usar la marca --auto-zone-exclude-zones para especificar una lista de zonas separadas por comas. La selección Zona automática elegirá una zona de la región especificada, pero excluirá las zonas enumeradas de sus criterios de selección. Ten en cuenta que debe haber al menos dos zonas no excluidas disponibles en la región del clúster.

Ejemplos:

Uso básico de la ubicación de zona automática:

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    other args ...

Zona automática con zonas excluidas:

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    --auto-zone-exclude-zones=ZONE_1,ZONE_2 \
    other args ...

API de REST

Para crear un clúster de Dataproc que use la posición de zona automática, construye una solicitud JSON clusters.create a la API y deja el campo gceClusterConfig.zoneUri vacío. En el extremo de REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, inserta un nombre de región. La zona automática de Dataproc seleccionará una zona para el clúster dentro de la región especificada.

Para excluir zonas específicas, puedes completar el campo gceClusterConfig.autoZoneExcludeZoneUris con una lista de nombres de zonas que se excluirán. Ten en cuenta que debe haber al menos dos zonas no excluidas disponibles en la región del clúster.

Usa nombres de recursos cortos con la posición de zona automática: Cuando especifiques un URI de recurso, como machineTypeUri o acceleratorTypeUri, en una solicitud de creación de clústeres de la API de REST de posición de zona automática, usa un nombre de recurso corto sin una especificación de zona, por ejemplo, "n1-standard-2" o "nvidia-tesla-t4".